说实话,我不愿意。这是个人观点,但我一直禁止大型语言模型访问我的网站,并且将来也会如此。我不喜欢将自己的心血(无论是文字还是代码)无偿提供给爬虫,尤其是像 OpenAI 或 Anthropic 这样的公司。
我的大部分域名都包含类似这样的文件:
https://pyxfluff.dev/robots.txt
https://pyxfluff.dev/llms.txt
当然,这纯属个人偏好。但如果人们不再允许这些公司窃取网站内容,这场 AI 热潮或许就会终结。也许最近谷歌的更新(许多人对此颇有微词)会让网站主们清醒过来,意识到如果不采取措施,他们的网站将不再有任何访问量。