للأسف، لا توجد طريقة مضمونة تمامًا لمنع روبوتات جمع البيانات من نماذج اللغة الكبيرة إذا كان محتوى موقعك متاحًا للعامة، حيث سيتجاهل الكثير منها ملف robots.txt وسيعمل حتى على التظاهر بأنه زائر بشري (باستخدام وكلاء مستخدمين وعناوين IP مختلفة) لتجاوز الحواجز. نأمل أن تتمكن بعض اللوائح القانونية من وضع ضوابط للوضع، إذ يبدو أن الكثيرين يفضلون أن يكون لديهم خيار بشأن ما إذا كان سيتم استخدام محتواهم بهذه الطريقة أم لا!
5 إعجابات