Qualcuno ha visto il web crawler GPTBot di OpenAI visitare il proprio sito?

Nota… Ho visto un sentimento fuorviante:

Bloccalo e basta

Questa è una relazione a senso unico

Ritengo che questo trascuri un punto importante. Avere OpenAI che esegue lo scraping di meta.discourse.org è stato estremamente vantaggioso per CDCK. Quando poni domande a GPT 4 su Discourse, ha almeno una possibilità di rispondere.

È una relazione a doppio senso:

Dai ad OpenAI l’accesso ai dati
OpenAI brucia foreste addestrando l’LLM sui tuoi dati, il che può tradursi in un valore per te.

Correlato anche: How to prevent community content from being used to train LLMs like ChatGPT?

Vediamo un certo accesso GPTBot nelle nostre flotte, circa 20-40 volte meno traffico rispetto a quello che vediamo da Googlebot.

Chiunque si senta a disagio può bloccarlo direttamente nell’interfaccia utente di Discourse, ma il bot sembra comportarsi molto bene rispetto ad alcuni maleducati che abbiamo visto.

8 Mi Piace