اضطراب الخطاب

kinetiksoft · 1 مارس 2023، 12:45م

لقد قمت أيضًا بتعديل استعلامك لعرض النتائج بطريقة أكثر ملاءمة باستخدام مستكشف البيانات.
الفضل يعود إلى ChatGPT و PostgreSQL clues by Leonardo:

SELECT
  json_extract_path_text(pcf.value::json, 'classification', 'toxicity') AS toxicity,
  json_extract_path_text(pcf.value::json, 'classification', 'severe_toxicity') AS severe_toxicity,
  json_extract_path_text(pcf.value::json, 'classification', 'obscene') AS obscene,
  json_extract_path_text(pcf.value::json, 'classification', 'identity_attack') AS identity_attack,
  json_extract_path_text(pcf.value::json, 'classification', 'insult') AS insult,
  json_extract_path_text(pcf.value::json, 'classification', 'threat') AS threat,
  json_extract_path_text(pcf.value::json, 'classification', 'sexual_explicit') AS sexual_explicit,
  json_extract_path_text(pcf.value::json, 'model') AS model,
  pcf.created_at,
  p.raw
FROM
  post_custom_fields AS pcf
INNER JOIN
  posts AS p ON p.id = pcf.post_id
INNER JOIN
  topics AS t ON t.id = p.topic_id
WHERE
  pcf.name = 'disorder' 
  AND t.archetype = 'regular'
ORDER BY created_at DESC

وهذا التعديل سيعيد الصفوف التي تكون فيها أي من قيم التصنيف أكبر من 50 (أو أي قيمة تحددها)

-- [params]
-- int :threshold = 50
SELECT DISTINCT ON (p.id, pcf.created_at)
  json_extract_path_text(pcf.value::json, 'classification', 'toxicity') AS toxicity,
  json_extract_path_text(pcf.value::json, 'classification', 'severe_toxicity') AS severe_toxicity,
  json_extract_path_text(pcf.value::json, 'classification', 'obscene') AS obscene,
  json_extract_path_text(pcf.value::json, 'classification', 'identity_attack') AS identity_attack,
  json_extract_path_text(pcf.value::json, 'classification', 'insult') AS insult,
  json_extract_path_text(pcf.value::json, 'classification', 'threat') AS threat,
  json_extract_path_text(pcf.value::json, 'classification', 'sexual_explicit') AS sexual_explicit,
  json_extract_path_text(pcf.value::json, 'model') AS model,
  p.id as post_id,
  pcf.created_at,
  p.raw
FROM
  post_custom_fields AS pcf
INNER JOIN
  posts AS p ON p.id = pcf.post_id
INNER JOIN
  topics AS t ON t.id = p.topic_id
WHERE
  pcf.name = 'disorder' 
  AND t.archetype = 'regular'
GROUP BY p.id, pcf.value, pcf.created_at
HAVING 
  CAST(json_extract_path_text(pcf.value::json, 'classification', 'toxicity') AS FLOAT) > :threshold 
  OR CAST(json_extract_path_text(pcf.value::json, 'classification', 'severe_toxicity') AS FLOAT) > :threshold 
  OR CAST(json_extract_path_text(pcf.value::json, 'classification', 'obscene') AS FLOAT) > :threshold 
  OR CAST(json_extract_path_text(pcf.value::json, 'classification', 'identity_attack') AS FLOAT) > :threshold 
  OR CAST(json_extract_path_text(pcf.value::json, 'classification', 'insult') AS FLOAT) > :threshold 
  OR CAST(json_extract_path_text(pcf.value::json, 'classification', 'threat') AS FLOAT) > :threshold 
  OR CAST(json_extract_path_text(pcf.value::json, 'classification', 'sexual_explicit') AS FLOAT) > :threshold
ORDER BY pcf.created_at DESC, p.id

يمكنك أيضًا تعديله عن طريق إدخال المزيد من المعلمات لتتمكن من تعيين عتبات مختلفة للإبلاغ باستخدام مستكشف البيانات.

يرجى ملاحظة: سيعيد هذا المنشورات العامة فقط، دون الوصول إلى الرسائل الخاصة.

Falco · 1 مارس 2023، 4:33م

نحن نعمل على هذه الميزة بالضبط الآن!

نحن نخطط أيضًا لاستخدام معدلات الإيجابيات / السلبيات الخاطئة لتشغيل مُحسِّن يمكنه اقتراح أفضل العتبات لكل خيار، لذا احتفظ بهذه المعلومات لأنها ستكون مفيدة في المستقبل القريب.

kinetiksoft · 1 مارس 2023، 4:47م

يبدو رائعًا. يسعدني سماع ذلك.
حتى الآن، أميل إلى رفض/تجاهل جميع العلامات التي يضعها Disorderbot، حتى مع رفع الحدود القصوى إلى 90-100. ولكن، نظرًا لطبيعة المنتدى الذي نختبره عليه (NSFW)، فإن الذكاء الاصطناعي يربك بسهولة إذا كان التواصل سامًا حقًا أم لا. طالما أنه ليس موثوقًا به لحالة الاستخدام الخاصة بنا، فسنستمر في استخدامه، ولكننا سنستخدم تقاريره فقط “لتعزيز” التقارير الأخرى حول المنشورات السامة حقًا.

بمجرد أن نجد بعض الحدود الأفضل لاستخدامها على المدى الطويل، سنتمكن من تمكين التحذيرات الاحترازية عندما يحاول المستخدم نشر شيء سام حقًا.

satonotdead · 1 مارس 2023، 5:01م

هذا ما أشك فيه عندما يصبح الذكاء الاصطناعي سائدًا. سيسمح بالرقابة ويحد من التساؤلات الحقيقية حول الوضع الراهن الضرورية لصحة كل مجتمع في العالم.

لا تحد أو تمنع، بل ثقف وناقش. ربما هناك طريقة لاستخدام الأدوات دون الآثار الجانبية (كما هي مخاوفي بأنها التأثير المطلوب) ولكنني أرى أن ذلك غير ممكن في الوقت الحالي.

شكرًا لملاحظاتك، فهي ذات قيمة بالنسبة لي. وبالطبع، شكرًا للفريق على مواصلة تحديث Discourse وتحسينه كالعادة

Falco · 1 مارس 2023، 5:50م

إن ضبط جميع العتبات على 100 والاعتماد فقط على العتبات الأكثر تطرفًا، مثل “السمية الشديدة” و “التهديد”، هو شيء يمكنني رؤيته يتم اعتماده في مجتمعات كهذه.

kinetiksoft · 1 مارس 2023، 5:56م

شكرا لك. تم ضبطه حاليًا على هذا النحو، ولا يزال حساسًا للغاية. سأقوم بزيادة بعضها أكثر وأرى كيف ستسير الأمور

Falco · 1 مارس 2023، 5:57م

سيتعين رؤية التصنيفات الأولية، لكنني سأزيد تصنيف الإهانة أولاً أيضًا.

kinetiksoft · 1 مارس 2023، 6:09م

من الأفضل أن أبعدك عن قراءة هذه قد تكون حقًا غير آمنة للمحتوى، حتى في شكل نصي
لقد رفعت الحد الأول إلى 100 أيضًا، وسأرى كيف ستسير الأمور الآن

kinetiksoft · 1 مارس 2023، 7:00م

آمل حقًا أن يكون من الممكن لـ Disorder عدم التحقق (أو عدم الإبلاغ) عن الرسائل الخاصة في الإصدارات المستقبلية. نحن لا نصل إليها ونشعر أن قيام الذكاء الاصطناعي بالتحقق من المحادثات الخاصة أمر غير أخلاقي للغاية.

Falco · 1 مارس 2023، 7:11م

نعم، هذا هو نفس الشيء الذي سأله @davidkingham، سنضعه في خارطة طريقنا.

ganncamp · 1 مارس 2023، 7:28م

… والإنجليزية؟

أيضًا، أتساءل إلى أي مدى يمكن لهذا أن يحل محل Akismet. لدينا معدل اختلاف بنسبة 97٪ على علامات Akismet الآن. يبدو أنه يتفاعل ببساطة مع المشاركات التي تحتوي على الكثير من الأرقام، لذلك إذا كنت تنشر سجلات الوظائف، حيث يبدأ كل سطر بختم زمني…

Falco · 1 مارس 2023، 7:35م

دخلت الحرب المسلحة بين البريد العشوائي وكشف البريد العشوائي مرحلة نووية مع ظهور نماذج اللغة الكبيرة المتاحة على نطاق واسع. نحن نعمل بجد على ميزات تستخدم مجموعة واسعة من النماذج، وبينما لا يعتبر البريد العشوائي من أولوياتنا حاليًا، إلا أنه شيء سنقوم بالتحقيق فيه.

mattdm · 2 مارس 2023، 4:34م

حسنًا، إذن: قمت بتشغيله. كيف أعرف أنه يعمل؟

بخلاف خفض العتبات إلى أدنى حد لالتقاط كل شيء، أعني.

هل هناك وضع تشخيص أو سجل حيث يمكنني رؤية ما تم تقييمه في منشور معين؟

kinetiksoft · 2 مارس 2023، 4:41م

الطريقة الأسهل هي استفزازه بنشر شيء مهين. تأكد من عدم تجاوز مجموعة المستخدمين الخاصة بك في إعدادات المكون الإضافي.

الطريقة الأفضل هي الاستعلام عن مستكشف البيانات. يرجى الرجوع إلى أحد استعلاماتي في هذا المنشور:

mattdm · 2 مارس 2023، 4:46م

شكرا لك. هذا يعيد أصفارًا في كل مكان لجميع المشاركات حتى الآن… هل هذا متوقع؟

kinetiksoft · 2 مارس 2023، 4:48م

غالبية مشاركاتنا تحتوي على أصفار في جميع المعايير أيضًا. هذا أمر طبيعي في منتدى يتمتع بتواصل صحي.

mattdm · 2 مارس 2023، 4:49م

رائع — لم أكن متأكدًا من مدى سرعة استجابة النموذج.

danielabc · 15 أبريل 2023، 5:08ص

لقد قمت بتثبيت المكون الإضافي، ولكنه لا يعمل، هل يجب علي إجراء تكوين إضافي؟

mjr4684 · 20 أبريل 2023، 5:44م

أواجه عددًا كبيرًا من الأخطاء التالية من المكون الإضافي:
Job exception: uninitialized constant Jobs::ClassifyChatMessage::ChatMessage

يبدو أن المشكلة تحدث عندما ينشئ أحد المكونات الإضافية الخاصة بي رسالة دردشة باستخدام الأمر التالي:
Chat::MessageCreator.create(chat_channel: matching_channel, user: message_user, content: raw).chat_message

شكرًا

Falco · 20 أبريل 2023، 6:06م

أوه، كان يجب أن يتعطل هذا مع إعادة تنظيم الدردشة الجديدة. نحن على وشك إطلاق إضافة جديدة ستدمج وظائف هذه الإضافة في الأيام القادمة، لذا ترقبوا.

الموضوع		الردود	مرات العرض
Have AI check for inappropriate post or at least words and flag the post Support ai , ai-toxicity	3	444	7 يوليو 2023
Introducing Discourse AI Blog	26	3712	4 مايو 2023
Setting up toxicity detection in your community Site Management automation , ai , how-to , moderation	0	1002	7 أغسطس 2024
Experiments with AI based moderation on Discourse Meta Community Building moderation , ai	11	922	26 مايو 2025
Setting up NSFW detection in your community Site Management moderation , automation , how-to , ai	1	1062	2 مارس 2026

اضطراب الخطاب

الموضوعات ذات الصلة