تحديد الهلوسات الذكية للبحث في محركات البحث

بالنسبة لأولئك منا الذين يعيشون الآن مع الهلوسات في البيانات العامة، نعلم أن تحديد الهلوسات يستغرق وقتًا طويلاً.

لذلك، عند التفكير في المشكلة، تذكرت أنه إذا استخدم المرء إخفاء التفاصيل في منشور، فهناك فرصة جيدة ألا يقوم محرك بحث محترم بفهرسته. أعرف هذا لأنني أستخدم هذه الميزة كثيرًا.

بينما يحقق إخفاء التفاصيل جزءًا من الحل، فإنه يخفي المعلومات التي يجب أن تكون مرئية في المقدمة. إذا تم بدلاً من ذلك تمييز البيانات المحددة ببيانات وصفية تشير إلى أنها تحتوي على هلوسة، ويمكن للبيانات الوصفية أن تمر من وقت الإنشاء إلى الاستخدام بواسطة واجهة برمجة تطبيقات أو عارض للإشارة إلى البيانات التي تحتوي على الهلوسة، فمن المؤمل أن يحل ذلك المشكلة. أيضًا، وجود خيار أيقونة مثل إخفاء التفاصيل ولكن للهلوسات سيكون لطيفًا بنفس القدر.

أعلم أن الكثيرين سيعتقدون أن هذه ليست مشكلة Discourse فقط، وأنا أتفق مع ذلك، لكن Discourse كيان كبير بما يكفي في هذا المجال بحيث يمكنهم تشكيل مجموعة مع كيانات أخرى ووضع معيار لمعالجة المشكلة، حيث ستزداد سوءًا بمرور الوقت. :slightly_smiling_face:

إعجابَين (2)

هل يمكن الافتراض بأمان أنك تتحدث عن الهلوسة فيما يتعلق بالبيانات غير الدقيقة التي ينتجها الذكاء الاصطناعي؟ هل هناك أي فائدة من التعامل مع هذه البيانات بشكل مختلف عن البيانات المضللة التي ينتجها البشر؟ هل وصلنا إلى نقطة يعامل فيها الناس هذه البيانات على أنها أكثر موثوقية من المنشورات البشرية؟

6 إعجابات

شكراً لك على تخصيص الوقت لقراءة هذا وطرح أسئلة ذات مغزى.

نعم!

في الوقت الحالي لا.

ومع ذلك، إذا كان لديك وصول إلى محامٍ في/للشركة، فقد يكون سؤالهم حول هذا الأمر مفيدًا. هذا أحد الأشياء التي تتطلع الحكومات إلى سن قوانين بشأنها، وبينما لست محاميًا، فإن تقديم خطة للحكومة قبل سن القوانين أفضل من سن القانون والاضطرار إلى الالتزام به.

نعم، اعتقد العديد من الباحثين أن الاستشهادات كانت حقيقية حتى لم يتمكنوا من العثور عليها. أنا لا أجمع مثل هذه الأشياء ولكن يمكنني الانتباه إليها وتدوينها إذا كنت ترغب في ذلك.

صورة تم إنشاؤها بواسطة الذكاء الاصطناعي تفوز بجائزة!

أنا أفهم ما تقصده ولكن هذا ليس السؤال الذي سأطرحه. ربما هذه الأسئلة بدلاً من ذلك.

هل يدرك الناس أن الذكاء الاصطناعي ينشئ الآن نصًا شبيهًا بالبشر يبدو صحيحًا ولكنه ليس كذلك؟
هل يدرك الناس أن الذكاء الاصطناعي ينشئ صورًا يقتنع الناس بأنها تم إنشاؤها بواسطة إنسان آخر؟ أو تبدو وكأنها مأخوذة بكاميرا ولكنها بدلاً من ذلك تم إنشاؤها بواسطة الذكاء الاصطناعي؟
هل يرغب الأشخاص مثل الباحثين والمعلمين وغيرهم ممن لديهم مصلحة في المعلومات الواقعية في معرفة أن الهلوسات تم تمييزها على هذا النحو باستخدام البيانات الوصفية؟ أو جاءت من مصدر معروف بتوليد الهلوسات؟

المشكلة الأكبر هي الآخرون الذين سيستغلون هؤلاء الأشخاص الذين لا يعرفون عن ذلك. إذا تم تمييز البيانات على أنها هلوسة وتم تنظيف البيانات من العلامة الوصفية، فلن أتفاجأ إذا تمكن محامٍ من استخدام ذلك لإظهار النية.

مرة أخرى، شكراً لاهتمامك. في الوقت الحالي، لا أخطط لدفع هذا الأمر إلى أبعد من ذلك لأنك تبدو أنك فهمت الفكرة ولكن إذا كانت لديك أسئلة أخرى، فلا بأس لدي في الإجابة. شخصياً، أفضل العيش في عالم لا نحتاج فيه إلى مرشحات البريد العشوائي، وبرامج مكافحة الفيروسات، والآن يبدو أننا بحاجة إلى فحوصات الهلوسات لأن الناس يريدون إساءة استخدام التكنولوجيا. :slightly_smiling_face:

أحد مخاوفي بشأن الذكاء الاصطناعي هو أنه مع تدريب الذكاء الاصطناعي على بيانات تم إنشاؤها بواسطة الذكاء الاصطناعي، ستصبح المعلومات مخففة أكثر فأكثر. لتجنب ذلك، قد يكون من مصلحة المنظمات التي تدرب نماذج اللغة الكبيرة (LLMs) على الإنترنت معرفة كيفية إنشاء البيانات التي تدرب عليها نموذج اللغة الكبير. قد يكون نوع من المعيار مفيدًا لهذا. على سبيل المثال، أود أن أرى نماذج اللغة الكبيرة تعتمد على استجابة ChatGPT لسؤال “ما هي أفضل مسارات الدراجات الجبلية في نانايمو لراكب دراجات جبلية متوسط المستوى؟” كبيانات موثوقة حول ركوب الدراجات الجبلية في نانايمو.

4 إعجابات

في هذا الصدد، سيكون من الأسهل بكثير وصف البيانات بما هي عليه، بدلاً من تشابك حجة حول النص الذي تم إنشاؤه بواسطة الكمبيوتر، خاصة عند مناقشته مع جمهور قد لا يمتلك المعلومات الأساسية.

إن تضمين تحيزك الخاص (سواء كان صحيحًا أم لا) في السؤال هو أمر مخادع إلى حد ما.

على سبيل المثال:

سيكون من المناسب وجود طريقة قياسية لتحديد النص المكتوب بواسطة نموذج لغوي توليدي (ذكاء اصطناعي حاسوبي).

لدينا بالفعل بعض الطرق، على سبيل المثال: @discobot roll 4d6

في غياب مؤلف صريح، فإن الاستشهاد المناسب هو على الأرجح أفضل نهج.

إعجابَين (2)

:game_die: 4, 6, 4, 5

إعجاب واحد (1)

نعم، الجمهور العام يقع بالفعل في فخ استخدام ChatGPT كما لو كان محرك بحث يقدم نتائج نهائية معقولة.

بالطبع هو ليس كذلك: إنه محتال خبير!

سألت “60 دقيقة” ChatGPT عن توصيات لكتب حول تأثير التضخم على الاقتصاد. استجاب بجدية بأسماء المؤلفين والكتب لستة كتب: لم يكن أي منها موجودًا!

سألت ChatGPT في مناسبتين منفصلتين عما إذا كان قد مات أحد في مهرجان Goodwood للسرعة.

أخبرني في كلتا المرتين أن هذا حدث مرة واحدة فقط، لكن في كل مرة أعطاني سنة واسمًا مختلفين.

هذا قيد كبير بالتأكيد ومشكلة.

إنها أداة رائعة ولكن لا يجب عليك استخدامها حاليًا للبحث بدون الإضافات المناسبة.

3 إعجابات

عند استهلاك منتدى بمحتوى تم إنشاؤه (سواء كان محتوى تم إنشاؤه بواسطة مستخدم أو محتوى تم إنشاؤه بواسطة الذكاء الاصطناعي)، يجب على المشاهد / المستهلك توخي الحذر.

لن يتحمل مالك المنتدى / لن يتحمل المسؤولية عن كل المحتوى الذي تم إنشاؤه والذي يتم نشره على منتداه لأن تحمل هذه المسؤولية يعني أيضًا تحمل المسؤولية القانونية. من خلال تمييز منشورات معينة على أنها “غير صحيحة من الناحية الواقعية”، قد يقترح مالك المنتدى عن غير قصد أن جميع المنشورات غير المميزة “صحيحة من الناحية الواقعية”، مما قد يتسبب في مشكلات كبيرة.

هذا يقودني إلى نقطتي بأن تقييم الصحة الواقعية والاستخدام العملي للمعلومات في منشورات المنتدى هو مسؤولية المستهلك، بدلاً من الناشر.

3 إعجابات

إذا كان هذا ردًا عليّ، فأنت لا تفهم ما ستفعله الميزة.

ستمنح الميزة المستخدمين القدرة على تحديد أجزاء من أي بيانات على أنها قد تحتوي على هلوسات. أنا أيضًا لا أطلب من أي كيان تحمل مسؤولية تحديد ذلك، بل منح المستخدمين عند إنشاء مثل هذه الطريقة لتحديد البيانات الوصفية بأنها قد تحتوي على هلوسات. وبالتالي، فإن ذكر “إخفاء التفاصيل”، يختار المستخدم استخدامها عند الحاجة ولا تنطبق إلا على القدر الذي يختاره المستخدم أو أقل منه، ويمكن استخدامه عدة مرات في نفس الرد.

ألا تطلب ببساطة مدقق حقائق؟

لذا بغض النظر عن المصدر (وبشكل أساسي لأنك لن تعرف)، سترغب في مراجعة منشور لمعرفة الأكاذيب.

من المفارقات أنني أستطيع أن أتخيل أن الحل قد يستخدم الذكاء الاصطناعي للقيام ببعض معالجة اللغة الطبيعية لهذه المهمة، لكنني سأتطرق إلى هذا الموضوع …

التعقيد المحتمل المؤسف هنا هو أنه سيواجه صعوبة مع التحيز السياسي أو في أي مكان قد تكون فيه الأيديولوجيا أو العقيدة متورطة، على سبيل المثال في بعض مجالات الطب، حيث لا توجد حقائق ثابتة يمكن الاعتماد عليها.

لكن يمكنني أن أرى بوضوح أن تأكيد حقيقة واضحة يمكن أن يكون مباشرًا، على سبيل المثال، تاريخ ومكان ميلاد شخصية مشهورة، على سبيل المثال. ألا يمكن بالتأكيد أتمتة ذلك ويجب أتمتتها؟

بالتأكيد مجال مثير للاهتمام للمراقبة، بالتأكيد!

إعجاب واحد (1)

لم يكن من المتوقع هذا العدد الكبير والمتنوع من الردود على طلب ميزة، فعادةً ما يتم نشرها وتترك لتجمع الغبار، والردود محل تقدير.

إليك شرح لسيناريوهين متعلقين بهذا الأمر، على أمل أن يمنحا فهمًا أفضل لطلب الميزة.

  1. يحدد المستخدم الهلوسات
    يستخدم المستخدم نموذجًا لغويًا كبيرًا، مثل ChatGPT، للحصول على معلومات حول الترانيم الغريغورية. يقوم بلصق إكمال ChatGPT في رد Discourse. بالنسبة للأجزاء التي تحتوي على هلوسات في الرد/الإكمال، يحدد المستخدم البيانات، وينقر على أيقونة للهلوسات، ويتم تحديث البيانات الوصفية للقسم، فكر في HTML span أو ما شابه، لإظهار أن المقطع يحتوي على هلوسة.

يمكن أن تكون المقاطع صغيرة مثل خيار لأمر سطر. بالنسبة لسطر الأوامر هذا الذي تم إنشاؤه بواسطة ChatGPT

gregorio -i --gregfont=“Caeciliae” myfile.gabc

يبدو أن خيار gregfont هو هلوسة، وبالتالي يجب تمييز هذا القسم --gregfont="Caeciliae" على أنه هلوسة.

إذا قام المرء بفحص HTML قبل وبعد التعليق، فسيشاهد شيئًا كهذا

قبل

<pre>
   <code class="hljs language-bash">gregorio -i --gregfont=<span class="hljs-string">"Caeciliae"</span> myfile.gabc
   </code>
</pre>

بعد

<pre>
   <code class="hljs language-bash">gregorio -i <span class="hallucination">--gregfont=<span class="hljs-string">"Caeciliae"</span></span> myfile.gabc
   </code>
</pre>
  1. تستهلك واجهة برمجة التطبيقات (API) البيانات التي تحتوي على هلوسات
    يبحث المستخدم عن سطر أوامر لإنشاء موسيقى ورقية غريغورية، ويقوم بتعديل الاستعلام لعدم تضمين الهلوسات. أثناء إنشاء محرك البحث للنتائج، يجد تطابقًا لصفحة تحتوي على الأمر

gregorio -i --gregfont=“Caeciliae” myfile.gabc

ثم يتحقق محرك البحث من سطور الأوامر الموجودة على الصفحة ويجد السطر المحدد الذي يلفت الانتباه. ثم يتحقق محرك البحث من سطر الأوامر لمعرفة ما إذا كان يحتوي على هلوسة ويجد عنصر span الذي يحتوي على الهلوسة ولا يتضمنه في نتيجة البحث.


من الواضح أنه يمكن إنشاء إضافة لأدوات مثل Chrome لإضافة مقاطع span المطلوبة، ولكن يجب أن يكون هناك أيضًا معيار، فكر في RFC، للبيانات الوصفية لجعلها قابلة للتحليل للاستخدام مع واجهات برمجة التطبيقات.

تم تخصيص السيناريوهات المذكورة أعلاه لصفحات الويب، ولكن يجب أن ينطبق الشيء نفسه على LaTeX، وما إلى ذلك.

بينما استخدمت السيناريوهات المذكورة أعلاه فقط قيمة عددية لتحديد الهلوسة، يمكن أن تكون البيانات الوصفية أكثر تعقيدًا، فكر في JSON أو نوع بيانات جبري.


مراجع غريغوريو

يبدو لي أن هذا طلب لميزة ستكون مفيدة في بعض المجتمعات، ولكن ليس كلها.

شخصيًا، سأكون سعيدًا برؤية النص الذي تم إنشاؤه بواسطة الآلة مخفيًا دائمًا داخل آلية تشبه “المفسد” (spoiler): أريد أن أعرف أن هذا هو ما هو عليه، وأريد معرفته قبل أن أستثمر وقتًا في قراءته.

ستكون هذه أيضًا فرصة لوضع شيء ما في القواعد المحلية: عدم تحديد النص الذي تم إنشاؤه بواسطة الآلة هو مخالفة يمكن الإبلاغ عنها.

وضع النص الذي تم إنشاؤه بواسطة الآلة داخل آلية تشبه “المفسد” يسمح أيضًا للمنشر بإضافة بعض التعليقات أو الوصف: قد يقومون بتضمين النص لأنه خاطئ بشكل مضحك، أو خاطئ تعليميًا، أو لأنه مفيد.

قضية نماذج اللغة المستقبلية التي يتم تدريبها جزئيًا على مخرجات نماذج اللغة القديمة… هذه مشكلة كبيرة على الأرجح، أكبر من علامات “المفسد”.

إعجاب واحد (1)

هذا كله جيد، ولكن بالتأكيد الخطوة الأولى هي تحديد أنه تم إنتاجه بواسطة آلة؟ نظرًا لأنك لا تعرف بعض المستخدمين من آدم …

قد يكون هذا مستحيلاً وكل ما يمكنك فعله هو التحقق من الدقة بطريقة ما …

إعجاب واحد (1)

أعتقد أن المشكلة تتعلق بالإشراف. بعض النصوص تبدو مشبوهة، ويتم إجراء استفسارات، ويتم تصنيفها على أنها “تم إنشاؤها بواسطة آلة ولكن لم يتم تمييزها على هذا النحو”، أو تصنيفها على أنها “بريد عشوائي محتمل”.

أعتقد أنني أفهم أن هناك بعض الأشخاص يحاولون إنشاء خدمات يمكنها اكتشاف النصوص التي تم إنشاؤها بواسطة آلة، لكنني لا أعرف مدى فعاليتها، أو كم ستكون تكلفتها. في عالم التعليم، يتعلق الأمر بالغش، وهناك دوافع لاكتشافه.

إعجاب واحد (1)