Примечание… Я заметил распространённое заблуждение:
Просто заблокируйте это
Это односторонние отношения
Мне кажется, здесь упущен один важный момент. То, что OpenAI индексирует meta.discourse.org, принесло CDCK огромную пользу. Когда вы задаёте GPT 4 вопросы о Discourse, у него хотя бы есть шанс дать правильный ответ.
Это двусторонние отношения:
Вы предоставляете OpenAI доступ к данным.
OpenAI тратит огромные ресурсы на обучение LLM на ваших данных, что может принести вам пользу.
Также по теме: How to prevent community content from being used to train LLMs like ChatGPT?
Мы наблюдаем некоторую активность GPTBot в наших сетях, но трафик примерно в 20–40 раз меньше, чем от Googlebot.
Если кто-то недоволен этим, можно напрямую заблокировать бота через интерфейс Discourse, но этот бот ведёт себя гораздо лучше, чем некоторые другие, с которыми нам приходилось сталкиваться.