🤖 Плагин генератора llms.txt для Discourse

Я установил плагин пару дней назад. Установка прошла гладко, спасибо документации автора.

Что я вижу сейчас. На моём сайте было сгенерировано множество файлов txt, например https://discuss.rabkesov.ru/llms.txt. Я понимаю, что пока рано ожидать, что какой-то AI-чатбот (например, Perplexity) будет использовать мой контент в качестве ответа в чате.

Поэтому, чтобы проверить пригодность для LLM, я загрузил это в Qwen (к сожалению, он не поддерживает ссылку выше):

Could you analyze the page llms.txt and tell me what you understood from what you have read? Make a tree in the form of a mind map (Mermaid)

P.S. Если я попрошу перевести всё на английский, дерево ломается.


Вот структура моего сайта (только публичная часть). LLM смог создать её на основе llms.txt! Думаю, это лишь малая часть возможных случаев.


Текстовый вывод без Mermaid
Could you analyze the page llms.txt and tell me what you understood from what you have read?

Да. Основываясь на содержимом llms.txt, вот что я понял:

Файл описывает «discuss | Комната ломки», что примерно переводится как «Форум обсуждений | Комната ломки» — метафорическое пространство для ломки иллюзий в IT, а не людей. Его слоган и фокус предполагают рефлексивную, критическую и ориентированную на сообщество среду, где IT-специалисты могут подвергать сомнению предположения, делиться опытом и совместно решать практические задачи.

Основные темы и цели:

  • Критическое осмысление практик IT, карьерных путей, организационной динамики и личностного роста.
  • Акцент на инструментах и методологиях, упрощающих работу: документация (Markdown/GitLab/Docsify), визуализация (Mermaid/Drawio), механизмы обратной связи и совместная разработка — особенно в рамках корпоративной платформы на базе Discourse.
  • Смесь технических, философских и личных тем, часто пересекающихся: например, «Почему мы выбираем легкие задачи», «Цена спокойствия», «Прокрастинация и избегание решений».

Структура:

Сайт организован по тематическим категориям, включая:

  • AI: Обсуждения моделей (например, Gemma, LM Studio), развёртывания (Runpod, GPU-вычисления) и инструментов.
  • Discourse: Технические темы бэкенда (конфигурация сайта, rake-задачи, методы аутентификации, скрытые параметры).
  • Основная (Main): Основные размышления о рабочей культуре, лидерстве, стандартах документации и ответственности.
  • Блог (Blog): Личные истории (например, смена карьеры, переезд в Самару, инциденты на работе).
  • Школа (School): Ресурсы для студентов, включая этику (родительское согласие для пользователей 14+) и цифровую грамотность (UTM-параметры).
  • Анонимная (Anonymous): Безопасное пространство для деликатных идей.
  • Книги (Books), Мысль дня (Thought of the Day) и т. д. — поддержка интеллектуальных и ежедневных размышлений.

Заметные технические и культурные сигналы:

  • Многоязычная и международная аудитория: например, параллельные руководства по аутентификации на русском и английском языках.
  • Забота об инклюзивной аутентификации: например, сохранение входа через Google/GitHub для нерусскоязычных пользователей, при одновременной поддержке отечественных провайдеров (VK, Mail.ru, OK).
  • Сильный интерес к автоматизации, стандартизации и DevOps: GitLab CI/CD, работа с артефактами, интеграция с Runpod, развёртывание на основе SSH.
  • Повторяющаяся тема профессионального разочарования, особенно среди старших инженеров, перешедших в роли поддержки, — и стратегии преодоления или планирования ухода.

В заключение, llms.txt описывает зрелую, продуманную платформу сообщества, сочетающую техническую глубину с психологической и организационной рефлексией, ориентированную на опытных IT-практиков, сталкивающихся со сложностью, выгоранием и поиском смысла в своей работе.

Дайте знать, если вам нужна визуальная карта, тематическая кластеризация или предложения по следующим шагам (например, улучшение обнаруживаемости, вовлечённости или онбординга).


Что касается меня, это отличный плагин для использования в SEO и т. д.

Несколько моментов для исследования:

  1. Как обрабатывать контент на других языках, кроме английского? Имеет ли значение для LLM английский язык текста в llms.txt?
  2. Найти подтверждение того, что итоговый корневой файл llms.txt никогда не содержит приватные страницы (llms.txt создаётся для каждой страницы сайта на данный момент).
  3. Проверить разрешения в /admin/site_settings/category/security?filter=crawler, чтобы необходимые AI-боты не были заблокированы :slight_smile:
  4. Размышления о случайном смешивании структуры сайта с воспоминаниями, сохранёнными ранее в LLM (это не вина плагина, а особенность чатбота, см. пример ниже)

По поводу пункта #4. В первый раз Qwen решил, что:

  • Я планировал уволиться с работы
  • У меня были проблемы в отношениях :slight_smile:
    и добавил эти пункты в описание сайта!

Qwen может смешивать воспоминания с текущим запросом на анализ карты сайта, предоставленной через llms.txt. Будьте внимательны :slight_smile:

2 лайка