Utilisation du support PDF et des pièces jointes avec les bots IA

:bookmark: Ce guide explique comment activer et utiliser la prise en charge native des pièces jointes PDF et des documents lors de l’interaction avec les robots IA dans Discourse. Les utilisateurs peuvent télécharger des PDF et d’autres documents directement dans les conversations avec les agents IA.

:person_raising_hand: Niveau d’utilisateur requis : Administrateur

Résumé

Discourse AI prend désormais en charge la gestion native des pièces jointes, permettant aux utilisateurs de télécharger des PDF et d’autres types de documents directement lors de la conversation avec les robots IA. L’IA peut lire et comprendre le contenu de ces pièces jointes, permettant des cas d’utilisation tels que l’analyse de documents, la synthèse et la réponse aux questions basées sur les fichiers téléchargés.

Cette fonctionnalité nécessite :

  • Des types de pièces jointes autorisés configurés sur le LLM
  • Un agent ayant la vision activée (cela contrôle si les téléchargements sont inclus dans les messages)
  • L’extension de fichier doit être autorisée dans les paramètres de téléchargement de votre site

Fournisseurs pris en charge

La prise en charge native des pièces jointes fonctionne avec les modèles des fournisseurs suivants :

  • Anthropic (modèles Claude)
  • AWS Bedrock (modèles Claude via Bedrock)
  • Google (modèles Gemini)
  • OpenAI (modèles GPT)
  • Azure (modèles compatibles OpenAI)
  • OpenRouter (modèles compatibles OpenAI)

Chaque fournisseur gère les pièces jointes différemment au niveau de l’API, mais Discourse AI gère cela automatiquement. Gardez à l’esprit que différents fournisseurs implémentent différents niveaux de prise en charge pour divers types de pièces jointes.

Types de pièces jointes pris en charge

Les types de documents suivants peuvent être configurés pour le traitement par l’IA :

Type Extensions
PDF pdf
Texte brut txt
Microsoft Word doc, docx
Format texte enrichi rtf
HTML html, htm
Markdown md, markdown

:information_source: Les images sont gérées séparément via le paramètre « Vision activée » et ne nécessitent pas de configuration de type de pièce jointe.

Configuration

Étape 1 : Autoriser les extensions de fichiers pour le téléchargement

Avant que les utilisateurs puissent télécharger des pièces jointes, assurez-vous que les extensions de fichiers sont autorisées dans les paramètres de votre site.

  1. Accédez à AdministrationFichiers
  2. Trouvez le paramètre authorized extensions (extensions autorisées)
  3. Ajoutez les extensions que vous souhaitez autoriser (par exemple, pdf|txt|docx)

Étape 2 : Configurer le modèle LLM

  1. Accédez à AdministrationPluginsDiscourse AILLMs
  2. Sélectionnez le modèle LLM que vous souhaitez configurer (ou créez-en un nouveau)
  3. Dans le champ Allowed attachments (Pièces jointes autorisées), sélectionnez ou tapez les extensions de fichiers que vous souhaitez que le modèle accepte (par exemple, pdf, txt, docx)

:warning: Si vous laissez le champ « Allowed attachments » vide, les pièces jointes de documents seront désactivées pour ce modèle. Les images sont contrôlées séparément via le basculeur « Vision enabled ».

Étape 3 : Configurer l’agent

  1. Accédez à AdministrationPluginsDiscourse AIAgents
  2. Sélectionnez ou créez un agent
  3. Assurez-vous que Vision enabled (Vision activée) est activé — cela contrôle si les téléchargements (images et documents) sont inclus dans les messages envoyés au LLM
  4. Définissez le Default model (Modèle par défaut) sur un LLM ayant des pièces jointes configurées

Comment ça fonctionne

Lorsqu’un utilisateur télécharge un document dans une conversation avec un robot IA :

  1. Le document est téléchargé sur Discourse en utilisant la gestion standard des téléchargements
  2. Discourse AI encode le contenu du document (base64)
  3. Le contenu encodé est envoyé au LLM avec le message de l’utilisateur
  4. Le LLM traite à la fois le message texte et le contenu du document
  5. L’IA répond en fonction du contexte combiné

Détails techniques

  • Les documents sont encodés en base64 et envoyés en ligne avec la requête
  • Chaque fournisseur reçoit les pièces jointes dans son format natif :
    • Anthropic : Utilise le type document avec source base64
    • Gemini : Utilise le format inlineData
    • OpenAI (API de complétion de chat) : Utilise le type file avec file_data contenant le contenu base64
    • OpenAI (API de réponses) : Utilise le type input_file avec file_data contenant le contenu base64
  • Les limites de taille de fichier sont régies par le paramètre max attachment size kb (taille maximale des pièces jointes en Ko) de votre site

Cas d’utilisation

La prise en charge native des pièces jointes permet plusieurs flux de travail :

  • Analyse de documents : Téléchargez des contrats, des rapports ou des articles de recherche pour que l’IA les résume ou réponde à des questions à leur sujet
  • Revue de contenu : Demandez à l’IA de réviser et de fournir des commentaires sur les brouillons de documents
  • Extraction de données : Extrayez des informations spécifiques à partir des documents téléchargés
  • Assistance à la traduction : Téléchargez des documents dans une langue et discutez du contenu ou demandez des traductions
  • Support technique : Les utilisateurs peuvent télécharger des fichiers journaux ou des fichiers de configuration pour une assistance au dépannage

Limitations

  • Taille des fichiers : Les pièces jointes sont limitées par les paramètres de taille de téléchargement de votre site et le fournisseur de LLM
  • Prise en charge du fournisseur : La prise en charge des pièces jointes nécessite un dialecte de fournisseur qui gère les documents (Anthropic, AWS Bedrock, Google, OpenAI, Azure et OpenRouter)
  • Exigence de vision de l’agent : L’agent doit avoir l’option « Vision enabled » activée pour que les téléchargements soient inclus dans les messages
  • Correspondance des extensions : L’extension du fichier doit être à la fois autorisée pour le téléchargement sur votre site et autorisée dans la configuration des types de pièces jointes du LLM
  • Les résultats varient : Étant donné que les fournisseurs de LLM et les LLM traitent les fichiers, le coût/la précision et les résultats varieront. Anthropic a tendance à utiliser plus de jetons pour l’analyse qu’OpenAI ou Google.
  • Activer la mise en cache : Pour OpenAI, assurez-vous d’utiliser l’API de réponses qui offre un support plus cohérent pour la mise en cache (lorsque la réflexion est activée). Pour les modèles Anthropic, vous devrez peut-être activer explicitement la mise en cache dans la configuration du LLM. Cela peut être particulièrement important lors de conversations à plusieurs tours.

Dépannage

Les pièces jointes ne sont pas traitées

  1. Vérifiez que l’extension du fichier est dans le paramètre authorized extensions de votre site
  2. Confirmez que le type de fichier est répertorié dans le paramètre « Allowed attachments » du LLM
  3. Assurez-vous que l’agent a « Vision enabled » activé et utilise un LLM correctement configuré

Le téléchargement échoue

  • Vérifiez votre paramètre max attachment size kb
  • Vérifiez que l’extension du fichier est autorisée
  • Les PDF très volumineux peuvent ne pas être pris en charge ; chaque fournisseur de LLM a des tailles de téléchargement maximales différentes.

L’IA ne comprend pas le document

  • Assurez-vous d’utiliser un modèle qui prend en charge la compréhension des documents
  • Essayez un modèle plus performant (par exemple, Claude Sonnet 4.5, GPT-5.1, Gemini Pro 3)

FAQs

Les utilisateurs peuvent-ils télécharger plusieurs documents dans un seul message ?
Oui, les utilisateurs peuvent inclure plusieurs pièces jointes dans un seul message, et l’IA y aura accès.

Cela fonctionne-t-il dans le chat ainsi que dans les MP ?
Oui, la prise en charge des pièces jointes fonctionne à la fois dans les messages privés avec les robots IA et dans les messages directs de discussion, à condition que l’agent soit configuré pour ces méthodes d’interaction.

Est-ce différent des téléchargements RAG sur les agents ?
Oui. Les téléchargements RAG sont des documents ajoutés par les administrateurs à la base de connaissances d’un agent, qui sont indexés et recherchés. La prise en charge native des pièces jointes permet aux utilisateurs finaux de télécharger des documents pendant les conversations pour une analyse immédiate sans indexation.

Qu’advient-il des documents téléchargés ?
Les documents sont traités conformément aux politiques standard de gestion et de conservation des téléchargements de votre site. Ils sont stockés comme des téléchargements Discourse normaux.

Ressources supplémentaires

4 « J'aime »