اضطراب الخطاب

لقد قمت أيضًا بتعديل استعلامك لعرض النتائج بطريقة أكثر ملاءمة باستخدام مستكشف البيانات.
الفضل يعود إلى ChatGPT و PostgreSQL clues by Leonardo:

SELECT
  json_extract_path_text(pcf.value::json, 'classification', 'toxicity') AS toxicity,
  json_extract_path_text(pcf.value::json, 'classification', 'severe_toxicity') AS severe_toxicity,
  json_extract_path_text(pcf.value::json, 'classification', 'obscene') AS obscene,
  json_extract_path_text(pcf.value::json, 'classification', 'identity_attack') AS identity_attack,
  json_extract_path_text(pcf.value::json, 'classification', 'insult') AS insult,
  json_extract_path_text(pcf.value::json, 'classification', 'threat') AS threat,
  json_extract_path_text(pcf.value::json, 'classification', 'sexual_explicit') AS sexual_explicit,
  json_extract_path_text(pcf.value::json, 'model') AS model,
  pcf.created_at,
  p.raw
FROM
  post_custom_fields AS pcf
INNER JOIN
  posts AS p ON p.id = pcf.post_id
INNER JOIN
  topics AS t ON t.id = p.topic_id
WHERE
  pcf.name = 'disorder' 
  AND t.archetype = 'regular'
ORDER BY created_at DESC
وهذا التعديل سيعيد الصفوف التي تكون فيها أي من قيم التصنيف أكبر من 50 (أو أي قيمة تحددها)
-- [params]
-- int :threshold = 50
SELECT DISTINCT ON (p.id, pcf.created_at)
  json_extract_path_text(pcf.value::json, 'classification', 'toxicity') AS toxicity,
  json_extract_path_text(pcf.value::json, 'classification', 'severe_toxicity') AS severe_toxicity,
  json_extract_path_text(pcf.value::json, 'classification', 'obscene') AS obscene,
  json_extract_path_text(pcf.value::json, 'classification', 'identity_attack') AS identity_attack,
  json_extract_path_text(pcf.value::json, 'classification', 'insult') AS insult,
  json_extract_path_text(pcf.value::json, 'classification', 'threat') AS threat,
  json_extract_path_text(pcf.value::json, 'classification', 'sexual_explicit') AS sexual_explicit,
  json_extract_path_text(pcf.value::json, 'model') AS model,
  p.id as post_id,
  pcf.created_at,
  p.raw
FROM
  post_custom_fields AS pcf
INNER JOIN
  posts AS p ON p.id = pcf.post_id
INNER JOIN
  topics AS t ON t.id = p.topic_id
WHERE
  pcf.name = 'disorder' 
  AND t.archetype = 'regular'
GROUP BY p.id, pcf.value, pcf.created_at
HAVING 
  CAST(json_extract_path_text(pcf.value::json, 'classification', 'toxicity') AS FLOAT) > :threshold 
  OR CAST(json_extract_path_text(pcf.value::json, 'classification', 'severe_toxicity') AS FLOAT) > :threshold 
  OR CAST(json_extract_path_text(pcf.value::json, 'classification', 'obscene') AS FLOAT) > :threshold 
  OR CAST(json_extract_path_text(pcf.value::json, 'classification', 'identity_attack') AS FLOAT) > :threshold 
  OR CAST(json_extract_path_text(pcf.value::json, 'classification', 'insult') AS FLOAT) > :threshold 
  OR CAST(json_extract_path_text(pcf.value::json, 'classification', 'threat') AS FLOAT) > :threshold 
  OR CAST(json_extract_path_text(pcf.value::json, 'classification', 'sexual_explicit') AS FLOAT) > :threshold
ORDER BY pcf.created_at DESC, p.id

يمكنك أيضًا تعديله عن طريق إدخال المزيد من المعلمات لتتمكن من تعيين عتبات مختلفة للإبلاغ باستخدام مستكشف البيانات.

يرجى ملاحظة: سيعيد هذا المنشورات العامة فقط، دون الوصول إلى الرسائل الخاصة.

3 إعجابات

نحن نعمل على هذه الميزة بالضبط الآن!

نحن نخطط أيضًا لاستخدام معدلات الإيجابيات / السلبيات الخاطئة لتشغيل مُحسِّن يمكنه اقتراح أفضل العتبات لكل خيار، لذا احتفظ بهذه المعلومات لأنها ستكون مفيدة في المستقبل القريب.

5 إعجابات

يبدو رائعًا. يسعدني سماع ذلك.
حتى الآن، أميل إلى رفض/تجاهل جميع العلامات التي يضعها Disorderbot، حتى مع رفع الحدود القصوى إلى 90-100. ولكن، نظرًا لطبيعة المنتدى الذي نختبره عليه (NSFW)، فإن الذكاء الاصطناعي يربك بسهولة إذا كان التواصل سامًا حقًا أم لا. طالما أنه ليس موثوقًا به لحالة الاستخدام الخاصة بنا، فسنستمر في استخدامه، ولكننا سنستخدم تقاريره فقط “لتعزيز” التقارير الأخرى حول المنشورات السامة حقًا.

بمجرد أن نجد بعض الحدود الأفضل لاستخدامها على المدى الطويل، سنتمكن من تمكين التحذيرات الاحترازية عندما يحاول المستخدم نشر شيء سام حقًا.

هذا ما أشك فيه عندما يصبح الذكاء الاصطناعي سائدًا. سيسمح بالرقابة ويحد من التساؤلات الحقيقية حول الوضع الراهن الضرورية لصحة كل مجتمع في العالم.

لا تحد أو تمنع، بل ثقف وناقش. ربما هناك طريقة لاستخدام الأدوات دون الآثار الجانبية (كما هي مخاوفي بأنها التأثير المطلوب) ولكنني أرى أن ذلك غير ممكن في الوقت الحالي.

شكرًا لملاحظاتك، فهي ذات قيمة بالنسبة لي. وبالطبع، شكرًا للفريق على مواصلة تحديث Discourse وتحسينه كالعادة :slight_smile:

إن ضبط جميع العتبات على 100 والاعتماد فقط على العتبات الأكثر تطرفًا، مثل “السمية الشديدة” و “التهديد”، هو شيء يمكنني رؤيته يتم اعتماده في مجتمعات كهذه.

3 إعجابات

شكرا لك. تم ضبطه حاليًا على هذا النحو، ولا يزال حساسًا للغاية. سأقوم بزيادة بعضها أكثر وأرى كيف ستسير الأمور

إعجاب واحد (1)

سيتعين رؤية التصنيفات الأولية، لكنني سأزيد تصنيف الإهانة أولاً أيضًا.

من الأفضل أن أبعدك عن قراءة هذه :smiley: قد تكون حقًا غير آمنة للمحتوى، حتى في شكل نصي
لقد رفعت الحد الأول إلى 100 أيضًا، وسأرى كيف ستسير الأمور الآن :smiley:

إعجاب واحد (1)

آمل حقًا أن يكون من الممكن لـ Disorder عدم التحقق (أو عدم الإبلاغ) عن الرسائل الخاصة في الإصدارات المستقبلية. نحن لا نصل إليها ونشعر أن قيام الذكاء الاصطناعي بالتحقق من المحادثات الخاصة أمر غير أخلاقي للغاية.

4 إعجابات

نعم، هذا هو نفس الشيء الذي سأله @davidkingham، سنضعه في خارطة طريقنا.

3 إعجابات

… والإنجليزية؟ :sweat_smile:

أيضًا، أتساءل إلى أي مدى يمكن لهذا أن يحل محل Akismet. لدينا معدل اختلاف بنسبة 97٪ على علامات Akismet الآن. يبدو أنه يتفاعل ببساطة مع المشاركات التي تحتوي على الكثير من الأرقام، لذلك إذا كنت تنشر سجلات الوظائف، حيث يبدأ كل سطر بختم زمني…

إعجاب واحد (1)

دخلت الحرب المسلحة بين البريد العشوائي وكشف البريد العشوائي مرحلة نووية مع ظهور نماذج اللغة الكبيرة المتاحة على نطاق واسع. نحن نعمل بجد على ميزات تستخدم مجموعة واسعة من النماذج، وبينما لا يعتبر البريد العشوائي من أولوياتنا حاليًا، إلا أنه شيء سنقوم بالتحقيق فيه.

4 إعجابات

حسنًا، إذن: قمت بتشغيله. كيف أعرف أنه يعمل؟

بخلاف خفض العتبات إلى أدنى حد لالتقاط كل شيء، أعني.

هل هناك وضع تشخيص أو سجل حيث يمكنني رؤية ما تم تقييمه في منشور معين؟

إعجابَين (2)

الطريقة الأسهل هي استفزازه بنشر شيء مهين. تأكد من عدم تجاوز مجموعة المستخدمين الخاصة بك في إعدادات المكون الإضافي.

الطريقة الأفضل هي الاستعلام عن مستكشف البيانات. يرجى الرجوع إلى أحد استعلاماتي في هذا المنشور:

إعجاب واحد (1)

شكرا لك. هذا يعيد أصفارًا في كل مكان لجميع المشاركات حتى الآن… هل هذا متوقع؟

إعجاب واحد (1)

غالبية مشاركاتنا تحتوي على أصفار في جميع المعايير أيضًا. هذا أمر طبيعي في منتدى يتمتع بتواصل صحي.

إعجابَين (2)

رائع — لم أكن متأكدًا من مدى سرعة استجابة النموذج. :slight_smile:

إعجاب واحد (1)

لقد قمت بتثبيت المكون الإضافي، ولكنه لا يعمل، هل يجب علي إجراء تكوين إضافي؟

أواجه عددًا كبيرًا من الأخطاء التالية من المكون الإضافي:
Job exception: uninitialized constant Jobs::ClassifyChatMessage::ChatMessage

يبدو أن المشكلة تحدث عندما ينشئ أحد المكونات الإضافية الخاصة بي رسالة دردشة باستخدام الأمر التالي:
Chat::MessageCreator.create(chat_channel: matching_channel, user: message_user, content: raw).chat_message

شكرًا

إعجاب واحد (1)

أوه، كان يجب أن يتعطل هذا مع إعادة تنظيم الدردشة الجديدة. نحن على وشك إطلاق إضافة جديدة ستدمج وظائف هذه الإضافة في الأيام القادمة، لذا ترقبوا.

5 إعجابات