Dies wäre eine RIESIGE Verbesserung, insbesondere für Foren, die viele Dokumentationen über PDFs, Scans oder Bilder enthalten. Wenn sich der Umfang auf die Suche beschränkt, müssten Sie idealerweise nur Text extrahieren/erstellen und diesen Text dann in einer Spalte in PostgreSQL speichern. Wenn Sie das tun, können Sie die bereits vorhandene Volltextsuche von PostgreSQL nutzen.
Unter Linux könnten Sie beispielsweise pdftotext verwenden, um den Text aus einer PDF-Datei zu extrahieren und in der Datenbank zu speichern. Eine weitere (teurere) Idee ist die Verwendung von KI-Vision, um die PDF oder das Bild zu erklären/extrahieren und in der Datenbank zu speichern.
Gedanken dazu?