Donc, j’ai examiné la question et j’ai élaboré un wireframe (avec l’aide de l’IA) sur la meilleure façon de procéder. Plusieurs idées me viennent à l’esprit. L’utilisation d’Apache TIKA nous permettrait d’effectuer une reconnaissance optique de caractères (OCR) sur presque tous les types de fichiers contenant du texte, y compris les images. Ce serait une option auto-hébergée. Et/ou : utiliser Gemini Flash 1.5 (par exemple) non seulement pour effectuer l’OCR, mais aussi pour décrire les images analysées, puis stocker ces données dans une colonne d’une table PostgreSQL pour la recherche. Bien sûr, cela nécessite un investissement important en jetons au départ pour régénérer tous les messages avec pièces jointes/téléversements, mais cela serait le plus utile. Je suppose que l’on obtient ce pour quoi l’on paie ?
1 « J'aime »