Gerador de Plugin Discourse llms.txt 🤖

Instalei o plugin há alguns dias. A instalação foi tranquila, graças à documentação do autor.

O que vejo agora. Muitos arquivos txt foram gerados no meu site, por exemplo https://discuss.rabkesov.ru/llms.txt. Eu sei que é muito cedo para esperar que um chatbot de IA (Perplexity) mostre meu conteúdo como resposta no chat.

Então, para verificar a capacidade de ser adequado para LLM, fiz o upload para o Qwen (infelizmente ele não suporta o link acima):

Você poderia analisar a página llms.txt e me dizer o que você entendeu do que leu? Faça uma árvore na forma de um mapa mental (Mermaid)

P.S. Se eu pedir para traduzir tudo para o inglês, a árvore quebra.

image
image

Aqui está a estrutura do meu site (apenas a parte pública). O LLM poderia criá-la a partir do llms.txt! Eu acho que este é apenas uma pequena parte dos casos possíveis.


Saída de texto sem Mermaid
Você poderia analisar a página llms.txt e me dizer o que você entendeu do que leu?

Sim. Com base no conteúdo de llms.txt, eis o que entendi:

O arquivo descreve “discuss | Комната ломки”, que se traduz aproximadamente como “Fórum de Discussão | A Sala da Quebra” — um espaço metaforicamente destinado a quebrar ilusões em TI, não pessoas. Seu slogan e foco sugerem um ambiente reflexivo, crítico e impulsionado pela comunidade, onde profissionais de TI podem examinar suposições, compartilhar experiências e colaborar em desafios práticos.

Temas Centrais e Propósito:

  • Reflexão crítica sobre práticas de TI, caminhos de carreira, dinâmicas organizacionais e crescimento pessoal.
  • Ênfase em ferramentas e metodologias que simplificam o trabalho: documentação (Markdown/GitLab/Docsify), visualização (Mermaid/Drawio), mecanismos de feedback e rascunho colaborativo — particularmente dentro de uma plataforma corporativa baseada em Discourse.
  • Uma mistura de tópicos técnicos, filosóficos e pessoais, frequentemente interligados: por exemplo, “Por que escolhemos tarefas fáceis”, “Custo da paz de espírito”, “Procrastinação e evitação de decisões”.

Estrutura:

O site é organizado em categorias temáticas, incluindo:

  • AI: Discussões sobre modelos (ex: Gemma, LM Studio), implantação (Runpod, calculadoras de GPU) e ferramentas.
  • Discourse: Tópicos de backend técnico (configuração do site, tarefas rake, métodos de autenticação, parâmetros ocultos).
  • Основная (Principal): Reflexões centrais sobre cultura de trabalho, liderança, padrões de documentação e responsabilidade.
  • Блог (Blog): Narrativas pessoais (ex: mudanças de carreira, realocação para Samara, incidentes no local de trabalho).
  • Школа (Escola): Recursos para estudantes, incluindo ética (consentimento parental para usuários com mais de 14 anos) e literacia digital (parâmetros UTM).
  • Анонимная (Anônima): Espaço seguro para ideias sensíveis.
  • Книги (Livros), Мысль дня (Pensamento do Dia), etc. — apoiando a reflexão intelectual e diária.

Sinais Técnicos e Culturais Notáveis:

  • Público multilíngue e internacional: por exemplo, guias de autenticação paralelos em russo/inglês.
  • Preocupação com a autenticação inclusiva: por exemplo, preservação do login do Google/GitHub para usuários não russos, ao mesmo tempo que suporta provedores domésticos (VK, Mail.ru, OK).
  • Forte interesse em automação, padronização e DevOps: GitLab CI/CD, manipulação de artefatos, integração com Runpod, implantação baseada em SSH.
  • Tema recorrente de desilusão profissional, especialmente entre engenheiros seniores transferidos para funções de suporte — e estratégias para lidar ou planejar saídas.

Em resumo, llms.txt descreve uma plataforma comunitária madura e cuidadosamente projetada que combina profundidade técnica com introspecção psicológica e organizacional — visando profissionais de TI experientes que navegam pela complexidade, esgotamento e busca por significado em seu trabalho.

Avise-me se você gostaria de um mapa visual, agrupamento temático ou sugestões para os próximos passos (por exemplo, melhorar a descoberta, engajamento ou integração).


Quanto a mim, é um ótimo plugin para ser usado em SEO, etc.

Alguns pontos para explorar:

  1. Como lidar com conteúdo não em inglês? A linguagem EN do texto em llms.txt importa para o LLM?
  2. Encontrar a prova de que o arquivo raiz final llms.txt nunca contém páginas privadas (llms.txt é criado para todas as páginas do site neste momento)
  3. Verificar as permissões em /admin/site_settings/category/security?filter=crawler para que os bots de IA necessários não sejam bloqueados :slight_smile:
  4. Pensamentos sobre a mistura ocasional da estrutura do site com as memórias que foram salvas anteriormente no LLM (isso não é culpa do plugin, mas um recurso do chatbot, veja o exemplo abaixo)

Sobre o ponto nº 4. Na primeira vez, o Qwen decidiu que:

  • Eu planejava deixar meu trabalho
  • Eu estava tendo problemas no relacionamento :slight_smile:
    e adicionou esses pontos à descrição do site!

O Qwen pode misturar memórias com a solicitação atual de análise do mapa do site, fornecida como llms.txt. Fique atento :slight_smile:

1 curtida