Contenuti del file di indice per la ricerca

dennisjbr · 21 Aprile 2026, 7:34am

Quindi, ho esaminato la questione e ho preparato una bozza (con l’aiuto dell’IA) su come raggiungere al meglio questo obiettivo. Mi vengono in mente alcune idee. Utilizzare Apache TIKA ci permetterebbe di eseguire l’OCR su quasi tutti i tipi di file contenenti testo, comprese le immagini. Sarebbe un’opzione self-hosted. E/O: Utilizzare Gemini Flash 1.5 (ad esempio) non solo per eseguire l’OCR, ma anche per descrivere le immagini analizzate, per poi archiviare tali dati in una colonna di una tabella PostgreSQL per la ricerca. Naturalmente, questo richiede un investimento significativo di token in anticipo per rielaborare tutti i post con allegati/caricamenti, ma sarebbe il più utile. Immagino che si ottiene ciò per cui si paga?

Argomento		Risposte	Visualizzazioni
Index PDFs for search Support	1	390	Ottobre 7, 2023
Searchable File Attachments Feature	12	2885	Maggio 3, 2022
Add support for searching pdf files in forum topics from AI personas Feature	3	143	Dicembre 12, 2025
Browser-based PDF Viewer with search and highlighting capabilities Feature	9	2627	Dicembre 15, 2020
Upload and discuss pdfs in composer Feature ai	5	314	Febbraio 24, 2025

Contenuti del file di indice per la ricerca

Argomenti correlati