Видел ли кто-нибудь, как веб-краулер OpenAI GPTBot посещал ваш сайт?

Примечание… Я заметил распространённое заблуждение:

Просто заблокируйте это

Это односторонние отношения

Мне кажется, здесь упущен один важный момент. То, что OpenAI индексирует meta.discourse.org, принесло CDCK огромную пользу. Когда вы задаёте GPT 4 вопросы о Discourse, у него хотя бы есть шанс дать правильный ответ.

Это двусторонние отношения:

Вы предоставляете OpenAI доступ к данным.
OpenAI тратит огромные ресурсы на обучение LLM на ваших данных, что может принести вам пользу.

Также по теме: How to prevent community content from being used to train LLMs like ChatGPT?

Мы наблюдаем некоторую активность GPTBot в наших сетях, но трафик примерно в 20–40 раз меньше, чем от Googlebot.

Если кто-то недоволен этим, можно напрямую заблокировать бота через интерфейс Discourse, но этот бот ведёт себя гораздо лучше, чем некоторые другие, с которыми нам приходилось сталкиваться.

8 лайков