Discourse 已具备代理就绪：以下是具体方法

Discourse · 2026 年5 月 22 日 03:12

论坛的受众正在发生变化。部分读者已不再是传统意义上的读者——他们实际上是代表他人行事的代理，将您的内容总结为答案，提供给那些可能永远不会点击链接或成为实际会员的人。无论您运营的是开发者支持社区、客户论坛还是粉丝俱乐部，您的知识此刻正被纳入人工智能的回答中。

这是针对原始帖子的配套讨论主题，原文链接为：https://blog.discourse.org/2026/05/discourse-is-agent-ready-heres-how/

eisammy · 2026 年5 月 22 日 13:20

一个真诚的问题：我为什么要允许 AI 爬虫淹没我的服务器？当然，文章明确指出选择权始终在我手中，但从商业角度出发，并以 Reddit 如何处理 AI 抓取为例，这样做的好处是什么？

最近我看到 Google 计划根据用户历史创建个性化页面，这意味着网站管理员的点击量减少，而 Alphabet 的收益增加。那么，重点究竟在哪里？

目前，我允许搜索引擎和缓存索引器（如 Wayback Machine）读取并缓存我的内容，但我无法从中看到任何好处，除了将用户的内容提供给 Alphabet 等公司进行变现，而我的社区却一无所获。此外，还存在法律层面的问题，例如我国的《个人数据保护法》（LGDP）或欧洲的《通用数据保护条例》（GDPR）。

Lilly · 2026 年5 月 22 日 13:22

这感觉像是由 AI 为 Discourse 以外的论坛撰写的：

这令人困惑。这是否经过人工员工的校对？

Canapin · 2026 年5 月 22 日 13:37

感谢分享这篇有趣的文章！

这可以说是 Discourse 最出色的功能之一。
每当我在其他网站上寻找只返回数据的网址却一无所获时，总会感到一阵尴尬。

如果您能为此类陈述始终附上来源链接，那将非常棒。这将有助于读者核实数据

awesomerobot · 2026 年5 月 22 日 13:52

这取决于你论坛的定位，例如如果是品牌论坛或技术支持论坛……你的目标可能是尽快为用户提供答案。如果内容被纳入 AI 训练，可能会带来益处。希望如果是真正未解决的问题，人们仍会访问你的网站提问，但如果他们优先使用 AI，这仍然具有挑战性。

在更偏向社交的语境下，AI 爬虫几乎毫无用处，因为你希望社区成员彼此互动。这种情况下，尝试完全屏蔽它们或许是个不错的选择。

Orioni · 2026 年5 月 22 日 14:34

从我个人在 AI 和 SEO 领域的专业角度来看，llms.txt 的影响和重要性尚未得到证实。最近，谷歌明确表示他们既不采用也不支持该标准。但这并不意味着其他智能体不会采用。不过，我认为有必要分享这一细微差别。

darkpixlz · 2026 年5 月 22 日 18:27

说实话，我不愿意。这是个人观点，但我一直禁止大型语言模型访问我的网站，并且将来也会如此。我不喜欢将自己的心血（无论是文字还是代码）无偿提供给爬虫，尤其是像 OpenAI 或 Anthropic 这样的公司。

我的大部分域名都包含类似这样的文件：
https://pyxfluff.dev/robots.txt
https://pyxfluff.dev/llms.txt

当然，这纯属个人偏好。但如果人们不再允许这些公司窃取网站内容，这场 AI 热潮或许就会终结。也许最近谷歌的更新（许多人对此颇有微词）会让网站主们清醒过来，意识到如果不采取措施，他们的网站将不再有任何访问量。

awesomerobot · 2026 年5 月 22 日 18:42

不幸的是，如果您的网站内容是公开可访问的，那么没有一种万无一失的方法可以阻止大型语言模型（LLM）的爬虫。其中许多爬虫会无视 robots.txt 文件，甚至试图伪装成人类访客（使用不同的用户代理和 IP 地址）来绕过封锁。希望某种法律监管能够为这种情况设立护栏，因为看起来许多人希望拥有选择权，决定自己的内容是否以这种方式被使用！

ted · 2026 年5 月 24 日 12:21

考虑到现有的法律监管（如许可证和版权）一直遭到完全无视，我对此并不抱太大希望。即使像谷歌这样的公司被提起集体诉讼并被处以数百亿美元的罚款，与其投入大语言模型的数千亿美元相比，这也不过是沧海一粟。“赢家通吃”的幂律动态使得这些公司的犯罪行为变得极其有利可图。

Eviepayne · 2026 年5 月 24 日 22:08

我认为此次更新应包含将 Anubis 作为支持的验证码。GitHub - TecharoHQ/anubis: Weighs the soul of incoming HTTP requests to stop AI crawlers · GitHub

话题		回复	浏览量
How to prevent community content from being used to train LLMs like ChatGPT? Community Building	69	4840	2023 年7 月 16 日
AI Citations - Does Discourse allow AI bot crawling? Support	10	253	2025 年8 月 12 日
SEO for AI: How Community Content Wins in New Search Blog	6	632	2025 年9 月 8 日
How do you use Discourse AI? Tell us and make it even better! Feature feedback , ai	20	2643	2025 年3 月 2 日
I populated my (mostly-dead) Discourse forum with bots! General show-and-tell	15	510	2026 年5 月 3 日

Discourse 已具备代理就绪：以下是具体方法

相关话题