🤖 Discourse llms.txt 生成器插件

我前几天安装了这个插件。得益于作者的文档,安装过程很顺利。

我现在看到的情况是:我的网站上生成了很多 txt 文件,例如 https://discuss.rabkesov.ru/llms.txt。我知道现在就期望看到某个 AI 聊天机器人(Perplexity)在聊天中将我的内容作为答案显示出来还为时过早。

所以,为了检查其是否适合 LLM,我将其上传到了 Qwen(不幸的是,它不支持上面的链接):

你能分析一下 llms.txt 页面,告诉我你从阅读中理解了什么吗?以思维导图(Mermaid)的形式制作一棵树

附注:如果我要求将所有内容翻译成英文,树就会断裂。

image
image


这是我网站的结构(仅公开部分)。LLM 可以根据 llms.txt 创建它!我认为这只是可能情况的一小部分。


没有 Mermaid 的文本输出
你能分析一下 llms.txt 页面,告诉我你从阅读中理解了什么吗?

是的。根据 llms.txt 的内容,我的理解如下:

该文件描述了 “discuss | Комната ломки”,大致翻译为 “讨论论坛 | 拆解室”——一个比喻性地旨在拆解 IT 领域幻觉而非人员的空间。其标语和重点表明这是一个反思性、批判性和社区驱动的环境,IT 专业人员可以在其中审视假设、分享经验并就实际挑战进行协作。

核心主题与目的:

  • 对 IT 实践、职业道路、组织动态和个人成长的批判性反思
  • 强调简化工作的工具和方法论:文档(Markdown/GitLab/Docsify)、可视化(Mermaid/Drawio)、反馈机制和协作起草——特别是在基于 Discourse 的企业平台内。
  • 技术、哲学和个人话题的混合,通常相互交叉:例如,“我们为什么选择简单的任务”、“安心的代价”、“拖延和避免决策”。

结构:

该网站组织成主题类别,包括:

  • AI:关于模型(如 Gemma、LM Studio)、部署(Runpod、GPU 计算器)和工具的讨论。
  • Discourse:技术后端主题(站点配置、rake 任务、身份验证方法、隐藏参数)。
  • Основная (主要):关于工作文化、领导力、文档标准和责任的核心反思。
  • Блог (博客):个人叙事(如职业变动、搬迁到萨马拉、工作场所事件)。
  • Школа (学校):为学生提供的资源,包括道德规范(14 岁以上用户的家长同意)和数字素养(UTM 参数)。
  • Анонимная (匿名):敏感想法的安全空间。
  • Книги (书籍)Мысль дня (每日一思) 等——支持智力和日常反思。

值得注意的技术与文化信号:

  • 多语言和国际受众:例如,平行的俄语/英语身份验证指南。
  • 包容性身份验证的关注:例如,为非俄罗斯用户保留 Google/GitHub 登录,同时也支持国内提供商(VK、Mail.ru、OK)。
  • 自动化、标准化和 DevOps 的浓厚兴趣:GitLab CI/CD、工件处理、Runpod 集成、基于 SSH 的部署。
  • 职业幻灭的反复出现的主题,特别是那些被调到支持角色的高级工程师——以及应对或计划退出的策略。

总之,llms.txt 概述了一个成熟、精心设计的社区平台,它将技术深度与心理和组织内省相结合——目标是经验丰富的 IT 从业者,他们在应对复杂性、职业倦怠和在工作中寻找意义。

如果您需要可视化地图、主题聚类或下一步建议(例如,提高可发现性、参与度或入职流程),请告诉我。


对我个人而言,这是一个非常棒的插件,可用于 SEO 等方面。

需要探讨的一些要点:

  1. 如何处理非英语内容?llms.txt 中 EN 语言的文本对 LLM 来说重要吗?
  2. 找到证据证明最终的根 llms.txt 从不包含私人页面(目前 llms.txt 是为网站的每一个页面创建的)
  3. 检查 /admin/site_settings/category/security?filter=crawler 的权限设置,以确保必要的 AI 机器人没有被阻止 :slight_smile:
  4. 关于网站结构与 LLM 之前保存的记忆偶尔混合的看法(这不是插件的错误,而是聊天机器人的特性,见下例)

关于第 4 点。Qwen 第一次就认为:

  • 我计划辞职
  • 我的感情出了问题 :slight_smile:
    并将这些要点添加到了网站描述中!

Qwen 可能会将记忆与当前分析站点地图的请求(以 llms.txt 的形式提供)混合在一起。请注意 :slight_smile:

1 个赞