Contenuti del file di indice per la ricerca

Questo sarebbe un ENORME miglioramento, specialmente per quei forum che contengono molta documentazione tramite PDF, scansioni o immagini. Se l’ambito di questo si limitasse alla ricerca, allora idealmente sarebbe sufficiente estrarre/creare testo e quindi archiviare quel testo in una colonna in postgres. Quando lo fai, puoi sfruttare la full-text di postgres già in atto.

In Linux, ad esempio, potresti usare pdftotext per estrarre il testo da un PDF e archiviarlo nel DB. Un’altra idea (più costosa) è usare la visione AI per spiegare/estrarre il PDF o l’immagine per archiviarla nel DB.

Pensieri?

2 Mi Piace