Infelizmente, não há uma maneira infalível de bloquear os raspadores de LLM se o conteúdo do seu site for publicamente acessível. Muitos deles ignoram o robots.txt e até tentam se passar por visitantes humanos (usando diferentes user agents e endereços IP) para contornar os bloqueios. Espera-se que algum tipo de regulamentação legal possa estabelecer limites para a situação, pois parece que muitas pessoas gostariam de ter a escolha de saber se seu conteúdo é usado dessa forma ou não!
5 curtidas