Usando suporte a PDF e anexos com bots de IA

:bookmark: Este guia explica como habilitar e usar o suporte nativo para anexos de PDF e documentos ao interagir com bots de IA no Discourse. Os usuários podem enviar PDFs e outros documentos diretamente nas conversas com agentes de IA.

:person_raising_hand: Nível de usuário necessário: Administrador

Resumo

O Discourse AI agora oferece suporte nativo ao manuseio de anexos, permitindo que os usuários enviem PDFs e outros tipos de documentos diretamente ao conversar com bots de IA. A IA pode ler e entender o conteúdo desses anexos, viabilizando casos de uso como análise de documentos, sumarização e respostas a perguntas com base nos arquivos enviados.

Este recurso requer:

  • Tipos de anexo permitidos configurados no LLM (Modelo de Linguagem Grande)
  • Um agente com “Visão ativada” (isso controla se os envios são incluídos nas mensagens)
  • A extensão do arquivo autorizada nas configurações de upload do seu site

Provedores Suportados

O suporte nativo a anexos funciona com modelos dos seguintes provedores:

  • Anthropic (modelos Claude)
  • AWS Bedrock (modelos Claude via Bedrock)
  • Google (modelos Gemini)
  • OpenAI (modelos GPT)
  • Azure (modelos compatíveis com OpenAI)
  • OpenRouter (modelos compatíveis com OpenAI)

Cada provedor lida com anexos de maneira diferente no nível da API, mas o Discourse AI gerencia isso automaticamente. Lembre-se de que diferentes provedores implementam diferentes níveis de suporte para vários tipos de anexo.

Tipos de Anexo Suportados

Os seguintes tipos de documento podem ser configurados para processamento pela IA:

Tipo Extensões
PDF pdf
Texto simples txt
Microsoft Word doc, docx
Rich Text Format rtf
HTML html, htm
Markdown md, markdown

:information_source: Imagens são tratadas separadamente por meio da configuração “Visão ativada” e não exigem configuração de tipo de anexo.

Configuração

Passo 1: Autorizar extensões de arquivo para upload

Antes que os usuários possam enviar anexos, certifique-se de que as extensões de arquivo estejam autorizadas nas configurações do seu site.

  1. Navegue até AdminFiles (Arquivos)
  2. Encontre a configuração authorized extensions (extensões autorizadas)
  3. Adicione as extensões que você deseja permitir (ex: pdf|txt|docx)

Passo 2: Configurar o modelo LLM

  1. Navegue até AdminPluginsDiscourse AILLMs
  2. Selecione o modelo LLM que deseja configurar (ou crie um novo)
  3. No campo Allowed attachments (Anexos permitidos), selecione ou digite as extensões de arquivo que você deseja que o modelo aceite (ex: pdf, txt, docx)

:warning: Se você deixar o campo “Allowed attachments” em branco, os anexos de documentos serão desabilitados para esse modelo. Imagens são controladas separadamente pela chave “Vision enabled”.

Passo 3: Configurar o agente

  1. Navegue até AdminPluginsDiscourse AIAgents (Agentes)
  2. Selecione ou crie um agente
  3. Certifique-se de que Vision enabled (Visão ativada) esteja ligado — isso controla se os envios (tanto imagens quanto documentos) são incluídos nas mensagens enviadas ao LLM
  4. Defina o Default model (Modelo padrão) para um LLM que tenha anexos configurados

Como funciona

Quando um usuário envia um documento em uma conversa com um bot de IA:

  1. O documento é enviado para o Discourse usando o manuseio de uploads padrão
  2. O Discourse AI codifica o conteúdo do documento (base64)
  3. O conteúdo codificado é enviado ao LLM junto com a mensagem do usuário
  4. O LLM processa tanto a mensagem de texto quanto o conteúdo do documento
  5. A IA responde com base no contexto combinado

Detalhes técnicos

  • Documentos são codificados como base64 e enviados embutidos na requisição
  • Cada provedor recebe anexos em seu formato nativo:
    • Anthropic: Usa o tipo document com fonte base64
    • Gemini: Usa o formato inlineData
    • OpenAI (API de Preenchimento de Chat): Usa o tipo file com file_data contendo o conteúdo base64
    • OpenAI (API de Respostas): Usa o tipo input_file com file_data contendo o conteúdo base64
  • Os limites de tamanho de arquivo são regidos pela configuração max attachment size kb do seu site

Casos de Uso

O suporte nativo a anexos possibilita vários fluxos de trabalho:

  • Análise de documentos: Envie contratos, relatórios ou artigos de pesquisa para a IA resumir ou responder perguntas sobre eles
  • Revisão de conteúdo: Peça à IA para revisar e fornecer feedback sobre rascunhos de documentos
  • Extração de dados: Extraia informações específicas de documentos enviados
  • Assistência de tradução: Envie documentos em um idioma e discuta o conteúdo ou solicite traduções
  • Suporte técnico: Os usuários podem enviar arquivos de log ou de configuração para obter assistência na solução de problemas

Limitações

  • Tamanho do arquivo: Anexos são limitados pelas configurações de tamanho de upload do seu site e pelo fornecedor do LLM
  • Suporte do provedor: O suporte a anexos requer um dialeto de provedor que lide com documentos (Anthropic, AWS Bedrock, Google, OpenAI, Azure e OpenRouter)
  • Requisito de visão do agente: O agente deve ter a opção “Vision enabled” ligada para que os envios sejam incluídos nas mensagens
  • Correspondência de extensão: A extensão do arquivo deve ser autorizada para upload no seu site e permitida na configuração de tipos de anexo do LLM
  • Resultados variam: Como os fornecedores de LLM e os LLMs estão processando os arquivos, o custo/precisão e os resultados variarão. O Anthropic tende a usar mais tokens para análise do que o OpenAI ou o Google.
  • Habilitar cache: Para OpenAI, certifique-se de usar a API de respostas, que oferece suporte mais consistente para cache (quando o “thinking” está ativado). Para modelos Anthropic, pode ser necessário habilitar o cache explicitamente na configuração do LLM. Isso pode ser particularmente importante ao ter conversas de várias etapas.

Solução de Problemas

Anexos não estão sendo processados

  1. Verifique se a extensão do arquivo está na configuração authorized extensions do seu site
  2. Confirme se o tipo de arquivo está listado na configuração “Allowed attachments” do LLM
  3. Certifique-se de que o agente tenha “Vision enabled” ativado e use um LLM configurado corretamente

O envio falha

  • Verifique sua configuração max attachment size kb
  • Verifique se a extensão do arquivo está autorizada
  • PDFs muito grandes podem não ser suportados; cada fornecedor de LLM tem tamanhos máximos de upload diferentes.

A IA não entende o documento

  • Certifique-se de estar usando um modelo que suporte a compreensão de documentos
  • Tente um modelo mais capaz (ex: Claude Sonnet 4.5, GPT-5.1, Gemini Pro 3)

Perguntas Frequentes

Os usuários podem enviar vários documentos em uma única mensagem?
Sim, os usuários podem incluir vários anexos em uma única mensagem, e a IA terá acesso a todos eles.

Isso funciona tanto no chat quanto em MPs (Mensagens Privadas)?
Sim, o suporte a anexos funciona em mensagens privadas com bots de IA e em mensagens diretas de chat, desde que o agente esteja configurado para esses métodos de interação.

Isso é diferente dos envios RAG em agentes?
Sim. Os envios RAG são documentos adicionados por administradores à base de conhecimento de um agente, que são indexados e pesquisados. O suporte nativo a anexos permite que os usuários finais enviem documentos durante as conversas para análise imediata, sem indexação.

O que acontece com os documentos enviados?
Os documentos são processados de acordo com o manuseio de upload padrão e as políticas de retenção do seu site. Eles são armazenados como uploads normais do Discourse.

Recursos Adicionais

4 curtidas