Limitation actuelle :
• La recherche sémantique du forum n’indexe que le texte des publications, pas les pièces jointes PDF
• Les fichiers PDF ne sont pas consultables via le basculement IA de /search
• Pour contourner cela, j’ai dû télécharger manuellement les PDF séparément dans le RAG de la persona
Solution proposée :
• Extraire le texte des pièces jointes PDF lors de la génération des intégrations (embeddings)
• Indexer le contenu des PDF à côté du texte des publications
• Rendre les sujets avec pièces jointes PDF découvrables via la recherche sémantique
Avantages :
• Les utilisateurs trouvent la documentation technique via la recherche sur le forum
• Pas besoin de dupliquer le contenu (publication sur le forum + téléchargement RAG)
• Meilleur référencement (SEO) (PDF joints aux sujets indexés)
• Architecture simplifiée (la commande de recherche fonctionne simplement)
Si vous deviez implémenter cela, je pourrais potentiellement :
- Supprimer les outils forcés (la recherche trouverait naturellement le contenu des PDF)
- Éliminer complètement les téléchargements RAG (tout serait dans les sujets du forum)
- Simplifier considérablement le système