¿Alguien ha visto el rastreador web de OpenAI, GPTBot, visitar su sitio?

Nota… He visto un sentimiento equivocado de:

Simplemente bloquéalo

Esta es una relación unidireccional

Creo que esto omite un punto importante. Que OpenAI rastree meta.discourse.org ha sido muy beneficioso para CDCK. Cuando le haces preguntas a GPT 4 sobre Discourse, tiene al menos una posibilidad de responderlas.

Es una relación bidireccional:

Le das a OpenAI acceso a datos
OpenAI quema bosques entrenando el LLM con tus datos, lo que puede resultar en valor para ti.

También relacionado: How to prevent community content from being used to train LLMs like ChatGPT?

Vemos algo de acceso a GPTBot en nuestras flotas, tal vez 20-40 veces menos tráfico que el que vemos de Googlebot.

Cualquiera que se sienta incómodo con él puede bloquearlo directamente en la interfaz de usuario de Discourse, pero el bot parece comportarse muy bien en comparación con algunos malos que hemos visto.

8 Me gusta