🀖 Discourse llms.txt ゞェネレヌタヌプラグむン

Discourse llms.txt 生成噚

:information_source: 抂芁 ChatGPT、Claude、その他の AI システムなどの倧芏暡蚀語モデルLLMがフォヌラムコンテンツを発芋できるようにする、llms.txt ファむルを自動的に生成したす
:hammer_and_wrench: リポゞトリリンク GitHub - kaktaknet/discourse-llms-txt-generator: 🀖 Discourse llms.txt Generator Plugin. Automatically generates llms.txt and llms-full.txt files for your Discourse forum to optimize content discovery by Large Language Models (LLMs) and AI systems. · GitHub
:open_book: むンストヌルガむド Discourse ぞのプラグむンのむンストヌル方法

機胜

このプラグむンは、りェブサむトから LLM 友奜型のコンテンツを提䟛するための提案された芏玄である llms.txt 暙準を実装しおいたす。これは、フォヌラムのコンテンツが AI 生成の回答に衚瀺されるのを助ける「AI 向けの robots.txt」ず考えおください。

詳现な機胜ドキュメントに぀いおは、README.md を参照しおください。

技術ドキュメントず開発に぀いおは、CONTRIBUTING.md を参照しおください。

この動画は Discourse やそのプラグむンに関するものではありたせんが、フォヌラムにずっお llms.txt ファむルがなぜ重芁なのかを非垞に良く説明しおいたす。

䞖界䞭の最倧か぀最も暩嚁のあるテクノロゞヌ䌁業の倚くを含む、䜕千ものサむトがすでに独自のドメむンで llms.txt 暙準を実装しおいたす。䟋を挙げるず以䞋の通りです

  • :white_check_mark: Amazon AWS — https://docs.aws.amazon.com/llms.txt
  • :white_check_mark: Cloudflare — https://developers.cloudflare.com/llms.txt
  • :white_check_mark: Stripe — https://stripe.com/llms.txt
  • :white_check_mark: Angular — https://angular.dev/llms.txt
  • :white_check_mark: Redis — https://redis.io/llms.txt
  • :white_check_mark: Docker — https://docs.docker.com/llms.txt
  • :white_check_mark: Model Context Protocol — https://modelcontextprotocol.io/llms-full.txt

業界の巚人が「公匏」になる遥か前に、倧芏暡でこの暙準を採甚するこずは、llms.txt が珟実的で緊急の課題を解決しおいるずいう明確なシグナルです。このような䌁業は、サむト党䜓のむニシアチブを軜々しく展開するこずはありたせん。垞に確固たる戊略的理由がありたす。テクノロゞヌ業界党䜓で llms.txt が急速か぀倧芏暡に受け入れられおいるこずは、AI 向けの構造化されたコンテンツがいかに重芁になっおいるかを瀺しおおり、業界自䜓が公匏の暙準化機関よりも早くこの採甚を掚進しおいるこずを意味したす。

䞻な機胜

  1. メむンナビゲヌションファむル (/llms.txt)

    • カテゎリ、サブカテゎリ、最新トピックを含むフォヌラムの構造化された抂芁
    • AI システムがフォヌラムの構造を即座に理解するのに圹立ちたす
    • フォヌラムが成長するに぀れお自動的に曎新されたす
  2. 完党コンテンツむンデックス (/llms-full.txt)

    • カテゎリ分けされ、AI による消費に備えられたすべおのトピックを含む完党なフォヌラムむンデックス
    • ビュヌ数ずトピック数によるフィルタリングの蚭定が可胜
    • 高速な AI むンデックス䜜成のためのオプションの投皿抜粋
  3. 動的リ゜ヌス別ファむル

    • 任意のカテゎリに察しお llms.txt を生成/c/category-name/123/llms.txt
    • 任意のトピックに察しお llms.txt を生成/t/topic-slug/456/llms.txt
    • 任意のタグに察しお llms.txt を生成/tag/tutorial/llms.txt
    • 物理的なストレヌゞなしでオンデマンド生成
  4. サむトマップむンデックス (/sitemaps.txt)

    • 効率的な AI クロヌラヌ発芋のためのすべおの llms.txt URL の完党リスト
    • robots.txt および sitemap.xml ず自動的に統合されたす
  5. SEO 保護

    • HTTP ヘッダヌ内の正芏 URLRFC 6596 準拠
    • 怜玢゚ンゞンからの重耇コンテンツペナルティを防止
    • 元のフォヌラム URL ぞの適切な垰属衚瀺
  6. スマヌトキャッシング

    • 新コンテンツの時間ごずのバックグラりンドチェック
    • 必芁な堎合のみ再生成
    • 高速レスポンス時間50ms 未満
  7. ボット制埡

    • フォヌラムぞのアクセスを蚱可し぀぀、特定の AI クロヌラヌをブロック
    • ブロックするナヌザヌ゚ヌゞェントのカンマ区切りリスト
    • ビュヌコネクタを介した自動 robots.txt 統合
  8. プラむバシヌずセキュリティ

    • プラむベヌトカテゎリは自動的に陀倖
    • 動的ファむルに察するガヌディアン暩限チェック
    • SQL レベルのセキュリティフィルタリング
    • 個人デヌタは露出したせん

フォヌラムぞのメリット

  • 可芖性の向䞊コンテンツが ChatGPT、Claude、その他の AI の回答に衚瀺されたす
  • 盎接垰属衚瀺AI システムがフォヌラムを匕甚し、リンクを貌り返したす
  • トラフィック増加AI 駆動型怜玢による発芋性の向䞊
  • GEO の改善AI システム向けの生成゚ンゞン最適化
  • メンテナンス䞍芁自動生成ず曎新

蚭定

プラグむンをむンストヌルした埌、管理 → 蚭定 → プラグむン → discourse-llms-txt-generator に移動したす。

ステップ 1プラグむンの有効化

llms_txt_enabled を true に蚭定したすデフォルトで有効。

ステップ 2むンデックス䜜成の蚭定

llms_txt_allow_indexing を true に蚭定しお、AI クロヌラヌのアクセスを蚱可したすデフォルトで有効。

この蚭定は、llms.txt ファむルが robots.txt で蚱可されるか犁止されるかを制埡したす。

ステップ 3コンテンツフィルタの蚭定

フォヌラムのサむズに応じおこれらの蚭定を構成したす

  • llms_txt_min_views含めるトピックの最小ビュヌ数デフォルト50
  • llms_txt_posts_limit含めるトピック数
    • small500 トピック倧芏暡フォヌラムにおすすめ
    • medium2,500 トピックほずんどのフォヌラムにおすすめ
    • large5,000 トピック
    • allすべおのトピック倧芏暡フォヌラムでは泚意しお䜿甚

ステップ 4オプション - カスタム説明の远加

フォヌラムの目的ずコミュニティを説明する 2〜4 文を llms_txt_full_description に蚘入したす。これにより、AI システムがフォヌラムに぀いおより正確な情報を提䟛できるようになりたす。

䟋

このフォヌラムは、Web 開発、デヌタサむ゚ンス、機械孊習に焊点を圓おた Python プログラミングの議論に専念しおいたす。私たちのコミュニティには、初心者から経隓豊富な開発者たでが含たれおおり、実践的な解決策やベストプラクティスを共有しおいたす。

ステップ 5オプション - 特定のボットのブロック

特定の AI クロヌラヌをブロックしたい堎合は、llms_txt_blocked_user_agents にナヌザヌ゚ヌゞェント名をカンマ区切りで入力したす

䟋Omgilibot, ChatGPT-User, CCBot

ステップ 6むンストヌルの確認

フォヌラムの以䞋の URL にアクセスしお確認したす

  • /llms.txt - メむンナビゲヌションファむル
  • /llms-full.txt - 完党コンテンツむンデックス
  • /sitemaps.txt - 完党サむトマップ

/robots.txt を確認しお、統合が正しく行われおいるか確認しおください。

蚭定項目

名前 デフォルト 説明
llms_txt_enabled true プラグむンの有効/無効
llms_txt_allow_indexing true AI クロヌラヌが llms.txt ファむルにアクセスするこずを蚱可robots.txt に圱響
llms_txt_blocked_user_agents "" llms.txt ファむルからブロックするボットのナヌザヌ゚ヌゞェントのカンマ区切りリスト
llms_txt_intro_text カスタムテキスト メむンの llms.txt ファむルに衚瀺される導入テキスト
llms_txt_full_description "" AI がフォヌラムの文脈を理解するための llms-full.txt のカスタム説明
llms_txt_min_views 50 llms-full.txt に含めるために必芁な最小トピックビュヌ数
llms_txt_posts_limit medium トピック数の制限small500、medium2,500、large5,000、たたは all
llms_txt_include_excerpts false llms-full.txt に投皿抜粋を含めるファむルサむズが倧幅に増加したす
llms_txt_post_excerpt_length 500 抜粋が有効な堎合の最倧抜粋長さ文字数100〜5000
llms_txt_latest_topics_count 50 メむンの llms.txt ファむルに衚瀺する最新トピックの数
llms_txt_cache_minutes 60 ナビゲヌションファむルのキャッシュ期間分

重芁な泚意点

  • llms_txt_posts_limit を all に蚭定した状態で llms_txt_include_excerpts を有効にするず、倧芏暡フォヌラムでは極めお倧きなファむルサむズ10〜100+ MB になる可胜性ありず高いサヌバヌ負荷を匕き起こす可胜性がありたす
  • プラむベヌトカテゎリは、すべおの llms.txt ファむルから自動的に陀倖されたす
  • 動的リ゜ヌス別ファむルカテゎリ、トピック、タグはキャッシュされず、オンデマンドで生成されたす
  • このプラグむンは robots.txt 統合のためにビュヌコネクタを䜿甚したす。robots.txt を手動で線集する必芁はありたせん

技術詳现

アヌキテクチャ

  • 事前生成されたファむルなしでのオンデマンド生成
  • 時間ごずのバックグラりンドチェックによるスマヌトキャッシング
  • Discourse Guardian を䜿甚した暩限察応
  • プラむベヌトコンテンツのための SQL レベルのセキュリティフィルタリング
  • SEO ペナルティを防止するための HTTP ヘッダヌ内の正芏 URL

パフォヌマンス

  • ナビゲヌションファむルは 60 分間キャッシュされたす蚭定可胜
  • 完党コンテンツファむルはオンデマンドで生成されたす
  • スマヌトキャッシュは新コンテンツが存圚する堎合にのみ再生成されたす
  • キャッシュされたコンテンツのレスポンス時間は 50ms 未満

互換性

  • Discourse 2.7.0+
  • Ruby 2.7+
  • Discourse 3.6.0.beta3 でテスト枈み

暙準準拠

  • llms.txt 暙準https://llmstxt.org/
  • RFC 3986囜際文字の URL ゚ンコヌディング
  • RFC 6596正芏リンクヘッダヌ

䜿甚事䟋

コミュニティフォヌラム
ナヌザヌが AI アシスタントに関連する質問をした際、ディスカッションや解決策が衚瀺され、質の高いトラフィックがフォヌラムに戻っおきたす。

ドキュメントサむト
AI システムがドキュメントやチュヌトリアルを参照し、適切な垰属衚瀺ずずもに正確な情報を提䟛できたす。

サポヌトフォヌラム
ナヌザヌは AI アシスタントを通じお知識ベヌスから盎接回答を埗られ、完党なディスカッションぞのリンクも提䟛されたす。

技術コミュニティ
開発者が AI 駆動型コヌディングアシスタントを通じおフォヌラムのコンテンツを発芋し、コミュニティの゚ンゲヌゞメントが高たりたす。

メンテナンス

このプラグむンは最小限のメンテナンスで枈みたす

  • キャッシュは自動的に 1 時間ごずに曎新されたす
  • 投皿の䜜成/線集時にコンテンツ曎新が自動的に発生したす
  • 手動でのファむル生成は䞍芁です
  • オプションの rake タスクが利甚可胜ですllms_txt:refresh および llms_txt:check

トラブルシュヌティング

ファむルにアクセスできない堎合

  • llms_txt_enabled が true であるこずを確認しおください
  • llms_txt_allow_indexing が true であるこずを確認しおください
  • 管理 → プラグむンでプラグむンがむンストヌルされおいるか確認しおください

コンテンツが空の堎合

  • 十分なビュヌ数を持぀公開トピックがあるこずを確認しおくださいllms_txt_min_views 蚭定を確認
  • カテゎリが公開読み取り制限なしであるこずを確認しおください
  • llms_txt_posts_limit 蚭定を確認しおください

robots.txt 統合が機胜しない堎合

  • robots.txt キャッシュをクリアRails.cache.delete('robots_txt')
  • rake タスクを䜿甚bundle exec rake llms_txt:refresh
  • Discourse を再起動./launcher restart app

サポヌト

ラむセンス

MIT ラむセンス - 無料でオヌプン゜ヌスの゜フトりェア

クレゞット

「いいね」 8

数日前にプラグむンをむンストヌルしたした。䜜者のドキュメントのおかげで、むンストヌルはスムヌズでした。

珟圚芋えおいるのは、サむトに倧量のtxtファむルが生成されおいるこずです。䟋えば https://discuss.rabkesov.ru/llms.txt のようなファむルです。AIチャットボットPerplexityなどがチャットで私のコンテンツを回答ずしお衚瀺するこずを期埅するのは時期尚早であるこずは承知しおいたす。

そこで、LLMに適しおいるかを確認するために、そのファむルをQwenにアップロヌドしおみたした残念ながら、䞊蚘のリンクはサポヌトされおいたせん。

ペヌゞ llms.txt を分析し、読んだ内容から䜕が理解できたか教えおください。マむンドマップの圢匏Mermaidでツリヌを䜜成しおください。

远䌞すべおを英語に翻蚳するように頌むず、ツリヌが壊れたす。

image
image

ここに私のサむトの構造がありたす公開郚分のみ。LLMは llms.txt からこれを生成できたはずですこれは可胜なケヌスのほんの䞀郚にすぎないず思いたす。


Mermaidなしのテキスト出力
ペヌゞ llms.txt を分析し、読んだ内容から䜕が理解できたか教えおください。

はい。llms.txt の内容に基づき、私が理解したこずは以䞋の通りです。

このファむルは “discuss | КПЌМата лПЌкО” に぀いお蚘述しおいたす。これは文字通りには「ディスカッションフォヌラム | 砎壊の郚屋」ず蚳され、比喩的にITにおける幻想を打ち砕くこずを意図した堎所であり、人々を打ち砕くためではありたせん。そのタグラむンず焊点は、IT専門家が仮定を怜蚌し、経隓を共有し、実践的な課題に぀いお協力するための、内省的で批刀的でコミュニティ䞻導の環境を瀺唆しおいたす。

䞭栞ずなるテヌマず目的:

  • ITの実践、キャリアパス、組織力孊、個人の成長に察する批刀的な内省。
  • 䜜業を簡玠化するツヌルず方法論Markdown/GitLab/Docsifyによるドキュメント䜜成、Mermaid/Drawioによる芖芚化、フィヌドバックメカニズム、共同ドラフト䜜成などに重点を眮く — 特にDiscourseベヌスの䌁業プラットフォヌム内での䜜業。
  • 技術的、哲孊的、個人的なトピックの混合が亀差する䟋「なぜ簡単なタスクを遞ぶのか」、「心の平和のコスト」、「先延ばしず意思決定の回避」。

構造:

サむトはテヌマ別のカテゎリに線成されおおり、以䞋が含たれたす。

  • AI: モデルGemma、LM Studioなど、デプロむメントRunpod、GPU蚈算機、およびツヌルに関する議論。
  • Discourse: サむト蚭定、rakeタスク、認蚌方法、隠しパラメヌタなど、技術的なバック゚ンドのトピック。
  • ОсМПвМая (メむン): 䜜業文化、リヌダヌシップ、ドキュメント暙準、責任に関する䞭栞的な考察。
  • БлПг (ブログ): 個人的な物語キャリア倉曎、サマヌラぞの移䜏、職堎の事件など。
  • КкПла (å­Šæ ¡): 孊生向けの資料。倫理14歳以䞊のナヌザヌの保護者の同意やデゞタルリテラシヌUTMパラメヌタなど。
  • АМПМОЌМая (匿名): 機密性の高いアむデアのための安党な堎所。
  • КМОгО (曞籍)、Мысль ЎМя (今日の考え) など — 知的および日々の内省をサポヌトするもの。

泚目すべき技術的および文化的なシグナル:

  • 倚蚀語および囜際的なオヌディ゚ンス: 䟋ずしお、䞊行するロシア語/英語の認蚌ガむド。
  • 包括的な認蚌ぞの配慮: 䟋ずしお、非ロシア語話者のためのGoogle/GitHubログむンの維持ず、囜内プロバむダヌVK、Mail.ru、OKのサポヌト。
  • 自動化、暙準化、DevOpsぞの匷い関心: GitLab CI/CD、アヌティファクト凊理、Runpodの統合、SSHベヌスのデプロむメント。
  • 専門職ずしおの幻滅、特にサポヌト職に異動したシニア゚ンゞニアからのもの — そしお、察凊法や退職蚈画に関する戊略。

芁玄するず、llms.txt は、技術的な深さず心理的・組織的な内省を融合させた、成熟した思慮深いコミュニティプラットフォヌムの抂芁を瀺しおおり、耇雑さ、燃え尜き症候矀、仕事における意味の探求を乗り切ろうずしおいる経隓豊富なIT実務者を察象ずしおいたす。

芖芚的なマップ、テヌマ別のクラスタリング、たたは次のステップの提案䟋発芋可胜性、゚ンゲヌゞメント、オンボヌディングの改善が必芁な堎合はお知らせください。


私ずしおは、SEOなどに䜿甚できる玠晎らしいプラグむンだず思いたす。

怜蚎すべき点がいく぀かありたす。

  1. 非英語のコンテンツをどのように凊理するか llms.txt 内のテキストのEN蚀語はLLMにずっお問題になりたすか
  2. 最終的なルヌトの llms.txt がプラむベヌトペヌゞを䞀切含たないこずの蚌明を芋぀ける珟圚、サむトのすべおのペヌゞに察しお llms.txt が䜜成されおいたす。
  3. 必芁なAIボットがブロックされおいないこずを確認するために、/admin/site_settings/category/security?filter=crawler での暩限を確認する :slight_smile:
  4. サむト構造ず、LLMに以前保存された蚘憶ずが時折混圚するこずに぀いおの考察これはプラグむンの欠陥ではなく、チャットボットの機胜です。以䞋の䟋を参照。

ポむント #4に぀いお。Qwenは初回に次のように刀断したした。

  • 私は仕事を蟞める぀もりだった
  • 私は人間関係で問題を抱えおいた :slight_smile:
    そしお、これらの点をサむトの説明に远加したした

Qwenは、サむトマップの分析ずいう珟圚のリク゚ストず、以前の蚘憶を混同する可胜性がありたす。泚意しおください :slight_smile:

「いいね」 2

このプラグむンをありがずうございたす。Discourse にずっお玠晎らしい远加機胜です。

もし他の誰かが、このプラグむンず Discourse の比范的新しい「半端な機胜」である llms.txt の実装有甚な凊理は䞀切行わず、完党に手動で実装されおいるものずの競合に盎面しおいる堎合に備えお、ここに蚘茉しおおきたす。

新しい Discourse の機胜は、蚭定されおいなくおも有効になっおいなくおも、/llms.txt のパスを完党に䞊曞きしおしたいたす。これが Discourse コアにおいお有甚あるいは本番環境察応の機胜ず芋なされおいるこずに、私は少し呆気にずられたした。

私にずっおは、/llms-full.txt や /sitemaps.txt は完璧に動䜜する䞀方で、メむンの /llms.txt パスが党く機胜したせんでした404 ゚ラヌ。

私の回避策は、/llms-full.txt を指す手動の llms.txt を䜜成し、それを手動でアップロヌドするこずです。

以䞋のどちらかが実珟されるずよいのですが

  • Discourse コアの機胜がアップグレヌドされ、このプラグむンが行うこずず同様の凊理を行う、たたは
  • llms.txt をアップロヌドしお有効化しない限り、Discourse コアの機胜が llms.txt を䞊曞きしたり、このプラグむンず競合したりしないようにする。
「いいね」 4

ご指摘ず報告をありがずうございたす。Enabling native LLMs.txt support in Discourse - #7 by pacharanero

/llms-full.txt はただ機胜しおいたすが、残念ながら /llms.txt は機胜しなくなっおいたす 

「いいね」 3

近い将来に䜕ができるかを確認し、コアがプラグむンの動䜜を䞊曞きしないようにアップデヌトをリリヌスしたす。それほど難しいこずにならないこずを願っおいたす。そもそも、プラグむンの哲孊の䞀郚は、このようなものを含めお、基本機胜や動䜜を䞊曞きし、埮調敎するこずにあるのですから。

「いいね」 1