Also, ich habe mich damit beschäftigt und (mit KI) ein Wireframe erstellt, wie man das am besten umsetzt. Dazu fallen mir ein paar Ideen ein. Die Nutzung von Apache Tika würde es uns ermöglichen, fast alle Dateitypen mit Text, einschließlich Bilder, per OCR zu verarbeiten. Das wäre eine selbst gehostete Option. Und/oder: Gemini Flash 1.5 (zum Beispiel) nutzen, um nicht nur OCR durchzuführen, sondern auch gesehene und analysierte Bilder zu beschreiben und diese Daten dann in einer PostgreSQL-Tabelle/-Spalte zur Suche abzulegen. Natürlich erfordert dies eine beträchtliche Investition an Tokens im Voraus, um alle Beiträge mit Anhängen/Uploads neu zu verarbeiten, aber es wäre am nützlichsten. Ich vermute, man bekommt, wofür man bezahlt?
1 „Gefällt mir“