Nota… Tenho visto um sentimento equivocado por aí de:
Apenas bloqueie
Este é um relacionamento unilateral
Sinto que isso está perdendo um ponto importante. Ter a OpenAI rastreando meta.discourse.org tem sido altamente benéfico para a CDCK. Quando você faz perguntas sobre o Discourse para o GPT 4, ele tem pelo menos uma chance de respondê-las.
É um relacionamento de mão dupla:
Você dá à OpenAI acesso a dados
A OpenAI queima florestas treinando o LLM com seus dados, o que pode resultar em valor para você.
Também relacionado: How to prevent community content from being used to train LLMs like ChatGPT?
Vemos algum acesso do GPTBot em nossas frotas, talvez 20-40x menos tráfego do que vemos do Googlebot.
Qualquer pessoa desconfortável com isso pode bloquear diretamente na interface do Discourse, mas o bot parece se comportar muito bem em comparação com alguns maus que vimos.