Alguém já viu o GPTBot, o crawler da OpenAI, visitar seu site?

Nota… Tenho visto um sentimento equivocado por aí de:

Apenas bloqueie

Este é um relacionamento unilateral

Sinto que isso está perdendo um ponto importante. Ter a OpenAI rastreando meta.discourse.org tem sido altamente benéfico para a CDCK. Quando você faz perguntas sobre o Discourse para o GPT 4, ele tem pelo menos uma chance de respondê-las.

É um relacionamento de mão dupla:

Você dá à OpenAI acesso a dados
A OpenAI queima florestas treinando o LLM com seus dados, o que pode resultar em valor para você.

Também relacionado: How to prevent community content from being used to train LLMs like ChatGPT?

Vemos algum acesso do GPTBot em nossas frotas, talvez 20-40x menos tráfego do que vemos do Googlebot.

Qualquer pessoa desconfortável com isso pode bloquear diretamente na interface do Discourse, mas o bot parece se comportar muito bem em comparação com alguns maus que vimos.

8 curtidas