Malheureusement, il n’existe aucun moyen infaillible de bloquer les robots d’extraction des LLM si le contenu de votre site est accessible au public. Beaucoup d’entre eux ignorent le fichier robots.txt et tentent même de se faire passer pour des visiteurs humains (en utilisant différents agents utilisateur et adresses IP) pour contourner les blocages. Espérons qu’une réglementation juridique puisse établir des garde-fous dans cette situation, car il semble que beaucoup de gens souhaitent pouvoir choisir si leur contenu est utilisé de cette manière ou non !
5 « J'aime »