Generador de plugins llms.txt para Discourse 🤖

Instalé el plugin hace un par de días. La instalación fue fluida, gracias a la documentación del autor.

Lo que veo ahora. Se generaron muchos archivos txt en mi sitio, por ejemplo https://discuss.rabkesov.ru/llms.txt. Sé que es pronto para esperar que un chatbot de IA (Perplexity) muestre mi contenido como respuesta en el chat.

Así que, para comprobar la capacidad de ser adecuado para LLM, lo subí a Qwen (desafortunadamente no admite el enlace anterior):

¿Podrías analizar la página llms.txt y decirme qué entendiste de lo que leíste? Haz un árbol en forma de mapa mental (Mermaid)

P.D. Si pido traducir todo al inglés, el árbol se rompe.

image
image

Aquí está la estructura de mi sitio (solo la parte pública). ¡Un LLM podría haberla creado a partir de llms.txt! Creo que es solo una pequeña parte de los casos posibles.


Salida de texto sin Mermaid
¿Podrías analizar la página llms.txt y decirme qué entendiste de lo que leíste?

Sí. Basado en el contenido de llms.txt, esto es lo que entendí:

El archivo describe “discuss | Комната ломки”, que se traduce aproximadamente como “Foro de Discusión | La Sala de Desarme” — un espacio metafóricamente destinado a desmantelar ilusiones en TI, no personas. Su lema y enfoque sugieren un entorno reflexivo, crítico y comunitario donde los profesionales de TI pueden examinar suposiciones, compartir experiencias y colaborar en desafíos prácticos.

Temas Centrales y Propósito:

  • Reflexión crítica sobre prácticas de TI, trayectorias profesionales, dinámicas organizacionales y crecimiento personal.
  • Énfasis en herramientas y metodologías que simplifican el trabajo: documentación (Markdown/GitLab/Docsify), visualización (Mermaid/Drawio), mecanismos de retroalimentación y redacción colaborativa — particularmente dentro de una plataforma corporativa basada en Discourse.
  • Una mezcla de temas técnicos, filosóficos y personales, a menudo interconectados: p. ej., “Por qué elegimos tareas fáciles”, “Costo de la tranquilidad”, “Procrastinación y evitación de decisiones”.

Estructura:

El sitio está organizado en categorías temáticas, que incluyen:

  • AI: Discusiones sobre modelos (p. ej., Gemma, LM Studio), implementación (Runpod, calculadoras de GPU) y herramientas.
  • Discourse: Temas técnicos del backend (configuración del sitio, tareas rake, métodos de autenticación, parámetros ocultos).
  • Основная (Principal): Reflexiones centrales sobre la cultura laboral, el liderazgo, los estándares de documentación y la responsabilidad.
  • Блог (Blog): Narrativas personales (p. ej., cambios de carrera, reubicación a Samara, incidentes en el lugar de trabajo).
  • Школа (Escuela): Recursos para estudiantes, incluida la ética (consentimiento paterno para usuarios mayores de 14 años) y la alfabetización digital (parámetros UTM).
  • Анонимная (Anónima): Espacio seguro para ideas sensibles.
  • Книги (Libros), Мысль дня (Pensamiento del Día), etc. — que apoyan la reflexión intelectual y diaria.

Señales Técnicas y Culturales Notables:

  • Audiencia multilingüe e internacional: p. ej., guías de autenticación paralelas en ruso/inglés.
  • Preocupación por la autenticación inclusiva: p. ej., preservar el inicio de sesión con Google/GitHub para usuarios no rusos, al tiempo que se admiten proveedores nacionales (VK, Mail.ru, OK).
  • Fuerte interés en la automatización, estandarización y DevOps: GitLab CI/CD, manejo de artefactos, integración de Runpod, implementación basada en SSH.
  • Tema recurrente de desilusión profesional, especialmente entre ingenieros sénior trasladados a roles de soporte, y estrategias para afrontarlo o planificar salidas.

En resumen, llms.txt describe una plataforma comunitaria madura y cuidadosamente diseñada que combina profundidad técnica con introspección psicológica y organizacional, dirigida a profesionales de TI experimentados que navegan por la complejidad, el agotamiento y la búsqueda de sentido en su trabajo.

Avísame si deseas un mapa visual, agrupación temática o sugerencias para los próximos pasos (p. ej., mejorar la capacidad de descubrimiento, la participación o la incorporación).


En cuanto a mí, es un gran plugin para usar en SEO, etc.

Algunos puntos a explorar:

  1. ¿Cómo manejar el contenido que no está en inglés? ¿Le importa al LLM el idioma EN del texto en llms.txt?
  2. Encontrar la prueba de que el archivo raíz final llms.txt nunca contiene páginas privadas (llms.txt se crea para cada página del sitio en este momento).
  3. Comprobar los permisos en /admin/site_settings/category/security?filter=crawler para que los bots de IA necesarios no estén bloqueados :slight_smile:
  4. Reflexiones sobre la mezcla ocasional de la estructura del sitio con los recuerdos que el LLM ha guardado previamente (esto no es culpa del plugin, sino una característica del chatbot, ver el ejemplo a continuación).

Sobre el punto #4. La primera vez, Qwen decidió que:

  • Planeaba dejar mi trabajo
  • Tenía problemas en mi relación :slight_smile:
    ¡y añadió estos puntos a la descripción del sitio!

Qwen puede mezclar recuerdos con la solicitud actual de analizar el mapa del sitio, proporcionado como llms.txt. Ten cuidado :slight_smile:

1 me gusta