Contenido del archivo index para búsqueda

dennisjbr · 21 Abril, 2026 07:34

Así que he estado investigando esto y he preparado un esquema (con ayuda de IA) sobre cómo lograrlo de la mejor manera. Se me ocurren algunas ideas. Usar Apache TIKA nos permitiría realizar OCR en casi cualquier tipo de archivo que contenga texto, incluidas las imágenes. Sería una opción autoalojada. O bien: usar Gemini Flash 1.5 (por ejemplo) no solo para realizar OCR, sino también para describir las imágenes que se ven y analizan, y luego guardar esos datos en una tabla/columna de PostgreSQL para su búsqueda. Por supuesto, esto requiere una inversión considerable de tokens por adelantado para volver a procesar todas las publicaciones con archivos adjuntos o subidas, pero sería lo más útil. Supongo que obtienes lo que pagas.

Tema		Respuestas	Vistas
Index PDFs for search Support	1	390	7 Octubre 2023
Searchable File Attachments Feature	12	2885	3 Mayo 2022
Add support for searching pdf files in forum topics from AI personas Feature	3	143	12 Diciembre 2025
Browser-based PDF Viewer with search and highlighting capabilities Feature	9	2625	15 Diciembre 2020
Upload and discuss pdfs in composer Feature ai	5	314	24 Febrero 2025

Contenido del archivo index para búsqueda

Temas relacionados