Contenu du fichier d'index pour la recherche

dennisjbr · Avril 21, 2026, 7:34

Donc, j’ai examiné la question et j’ai élaboré un wireframe (avec l’aide de l’IA) sur la meilleure façon de procéder. Plusieurs idées me viennent à l’esprit. L’utilisation d’Apache TIKA nous permettrait d’effectuer une reconnaissance optique de caractères (OCR) sur presque tous les types de fichiers contenant du texte, y compris les images. Ce serait une option auto-hébergée. Et/ou : utiliser Gemini Flash 1.5 (par exemple) non seulement pour effectuer l’OCR, mais aussi pour décrire les images analysées, puis stocker ces données dans une colonne d’une table PostgreSQL pour la recherche. Bien sûr, cela nécessite un investissement important en jetons au départ pour régénérer tous les messages avec pièces jointes/téléversements, mais cela serait le plus utile. Je suppose que l’on obtient ce pour quoi l’on paie ?

Sujet		Réponses	Vues
Index PDFs for search Support	1	390	Octobre 7, 2023
Searchable File Attachments Feature	12	2885	Mai 3, 2022
Add support for searching pdf files in forum topics from AI personas Feature	3	143	Décembre 12, 2025
Browser-based PDF Viewer with search and highlighting capabilities Feature	9	2625	Décembre 15, 2020
Upload and discuss pdfs in composer Feature ai	5	314	Février 24, 2025

Contenu du fichier d'index pour la recherche

Sujets connexes