Usando soporte para PDF y adjuntos con bots de IA

sam · 11 Diciembre, 2025 05:32

Esta guía explica cómo habilitar y usar el soporte nativo de archivos PDF y documentos adjuntos al interactuar con bots de IA en Discourse. Los usuarios pueden cargar PDFs y otros documentos directamente en las conversaciones con los agentes de IA.

Nivel de usuario requerido: Administrador

Resumen

Discourse AI ahora admite el manejo nativo de archivos adjuntos, lo que permite a los usuarios cargar PDFs y otros tipos de documentos directamente al conversar con bots de IA. La IA puede leer y comprender el contenido de estos archivos adjuntos, lo que permite casos de uso como el análisis de documentos, la creación de resúmenes y la respuesta a preguntas basadas en los archivos cargados.

Esta característica requiere:

Tipos de archivos adjuntos permitidos configurados en el LLM
Un agente con la visión habilitada (esto controla si las cargas se incluyen en los mensajes)
Que la extensión del archivo esté autorizada en la configuración de carga de su sitio

Proveedores compatibles

El soporte nativo de archivos adjuntos funciona con modelos de los siguientes proveedores:

Anthropic (modelos Claude)
AWS Bedrock (modelos Claude a través de Bedrock)
Google (modelos Gemini)
OpenAI (modelos GPT)
Azure (modelos compatibles con OpenAI)
OpenRouter (modelos compatibles con OpenAI)

Cada proveedor maneja los archivos adjuntos de manera diferente a nivel de API, pero Discourse AI lo gestiona automáticamente. Tenga en cuenta que diferentes proveedores implementan diferentes niveles de soporte para varios tipos de archivos adjuntos.

Tipos de archivos adjuntos compatibles

Los siguientes tipos de documentos se pueden configurar para el procesamiento de IA:

Tipo	Extensiones
PDF	`pdf`
Texto sin formato	`txt`
Microsoft Word	`doc`, `docx`
Formato de texto enriquecido	`rtf`
HTML	`html`, `htm`
Markdown	`md`, `markdown`

Las imágenes se gestionan por separado a través de la configuración “Visión habilitada” y no requieren configuración del tipo de archivo adjunto.

Configuración

Paso 1: Autorizar extensiones de archivo para la carga

Antes de que los usuarios puedan cargar archivos adjuntos, asegúrese de que las extensiones de archivo estén autorizadas en la configuración de su sitio.

Navegue a Administrador → Archivos
Busque la configuración extensiones autorizadas
Agregue las extensiones que desea permitir (ejemplo: pdf|txt|docx)

Paso 2: Configurar el modelo LLM

Navegue a Administrador → Plugins → Discourse AI → LLMs
Seleccione el modelo LLM que desea configurar (o cree uno nuevo)
En el campo Archivos adjuntos permitidos, seleccione o escriba las extensiones de archivo que desea que acepte el modelo (ejemplo: pdf, txt, docx)

Si deja en blanco el campo “Archivos adjuntos permitidos”, los archivos adjuntos de documentos se deshabilitarán para ese modelo. Las imágenes se controlan por separado a través del interruptor “Visión habilitada”.

Paso 3: Configurar el agente

Navegue a Administrador → Plugins → Discourse AI → Agentes
Seleccione o cree un agente
Asegúrese de que Visión habilitada esté activado; esto controla si las cargas (tanto de imágenes como de documentos) se incluyen en los mensajes enviados al LLM
Establezca el Modelo predeterminado en un LLM que tenga archivos adjuntos configurados

Cómo funciona

Cuando un usuario carga un documento en una conversación con un bot de IA:

El documento se carga en Discourse utilizando el manejo estándar de cargas
Discourse AI codifica el contenido del documento (base64)
El contenido codificado se envía al LLM junto con el mensaje del usuario
El LLM procesa tanto el mensaje de texto como el contenido del documento
La IA responde basándose en el contexto combinado

Detalles técnicos

Los documentos se codifican como base64 y se envían en línea con la solicitud
Cada proveedor recibe los archivos adjuntos en su formato nativo:
- Anthropic: Utiliza el tipo document con fuente base64
- Gemini: Utiliza el formato inlineData
- OpenAI (API de finalización de chat): Utiliza el tipo file con file_data que contiene el contenido base64
- OpenAI (API de respuestas): Utiliza el tipo input_file con file_data que contiene el contenido base64
Los límites de tamaño de archivo se rigen por la configuración max attachment size kb (tamaño máximo de archivo adjunto en KB) de su sitio

Casos de uso

El soporte nativo de archivos adjuntos permite varios flujos de trabajo:

Análisis de documentos: Cargue contratos, informes o artículos de investigación para que la IA los resuma o responda preguntas sobre ellos
Revisión de contenido: Pida a la IA que revise y proporcione comentarios sobre borradores de documentos
Extracción de datos: Extraiga información específica de documentos cargados
Asistencia de traducción: Cargue documentos en un idioma y discuta el contenido o solicite traducciones
Soporte técnico: Los usuarios pueden cargar archivos de registro o de configuración para obtener ayuda en la resolución de problemas

Limitaciones

Tamaño del archivo: Los archivos adjuntos están limitados por la configuración de tamaño de carga de su sitio y el proveedor del LLM
Soporte del proveedor: El soporte de archivos adjuntos requiere un dialecto de proveedor que maneje documentos (Anthropic, AWS Bedrock, Google, OpenAI, Azure y OpenRouter)
Requisito de visión del agente: El agente debe tener activada la opción “Visión habilitada” para que las cargas se incluyan en los mensajes
Coincidencia de extensiones: La extensión del archivo debe estar autorizada para la carga en su sitio y permitida en la configuración de tipos de archivos adjuntos del LLM
Los resultados varían: Dado que los proveedores de LLM y los LLM procesan los archivos, el costo/precisión y los resultados variarán. Anthropic tiende a usar más tokens para el análisis que OpenAI o Google.
Habilitar el almacenamiento en caché: Para OpenAI, asegúrese de utilizar la API de respuestas, que ofrece un soporte más consistente para el almacenamiento en caché (cuando el pensamiento está habilitado); para los modelos Anthropic, es posible que deba habilitar el almacenamiento en caché explícitamente en la configuración del LLM. Esto puede ser particularmente importante al tener conversaciones de varios turnos.

Solución de problemas

Los archivos adjuntos no se procesan

Verifique que la extensión del archivo esté en la configuración de extensiones autorizadas de su sitio
Confirme que el tipo de archivo esté listado en la configuración de “Archivos adjuntos permitidos” del LLM
Asegúrese de que el agente tenga activada la opción “Visión habilitada” y utilice un LLM configurado correctamente

La carga falla

Verifique su configuración max attachment size kb (tamaño máximo de archivo adjunto en KB)
Verifique que la extensión del archivo esté autorizada
Los PDFs muy grandes podrían no ser compatibles; cada proveedor de LLM tiene diferentes tamaños máximos de carga.

La IA no entiende el documento

Asegúrese de estar utilizando un modelo que admita la comprensión de documentos
Pruebe un modelo más capaz (ejemplo: Claude Sonnet 4.5, GPT-5.1, Gemini Pro 3)

Preguntas frecuentes

¿Pueden los usuarios cargar varios documentos en un solo mensaje?
Sí, los usuarios pueden incluir varios archivos adjuntos en un solo mensaje, y la IA tendrá acceso a todos ellos.

¿Funciona esto en el chat además de en los MD?
Sí, el soporte para archivos adjuntos funciona tanto en mensajes privados con bots de IA como en mensajes directos de chat, siempre que el agente esté configurado para esos métodos de interacción.

¿Es esto diferente de las cargas RAG en los agentes?
Sí. Las cargas RAG son documentos añadidos por los administradores a la base de conocimientos de un agente, los cuales son indexados y buscados. El soporte nativo de archivos adjuntos permite a los usuarios finales cargar documentos durante las conversaciones para un análisis inmediato sin indexación.

¿Qué sucede con los documentos cargados?
Los documentos se procesan de acuerdo con el manejo estándar de cargas y las políticas de retención de su sitio. Se almacenan como cargas normales de Discourse.

Tema		Respuestas	Vistas
Native PDF and attachment support in Discourse AI Announcements ai	0	123	11 Diciembre 2025
PDF support in Discourse AI (RAG) Site Management how-to , ai	20	1070	5 Diciembre 2025
Discourse AI Persona, upload support Announcements ai , ai-bot	20	1792	11 Septiembre 2025
Allow ChatBot to read PDFs so it can join in a group discussion Feature ai , ai-bot	6	995	12 Octubre 2023
[Ai Bot] Add user token tracking, custom AI personas, max context posts, document loading, custom API URLs, and localized chat titles Feature ai , ai-bot	1	602	22 Marzo 2024