Per favore, aggiungete il supporto per la ricerca di file pdf nei topic del forum dalle AI persona - senza doverli caricare separatamente!

Limitazione attuale:
• La ricerca semantica del forum indicizza solo il testo dei post, non gli allegati PDF
• I file PDF non sono ricercabili tramite l’interruttore AI /search
• Per aggirare questo problema, ho dovuto caricare manualmente i PDF separatamente nel RAG della persona

Soluzione proposta:
• Estrarre il testo dagli allegati PDF durante la generazione degli embedding
• Indicizzare i contenuti dei PDF insieme al testo dei post
• Rendere gli argomenti con allegati PDF scopribili tramite la ricerca semantica

Vantaggi:
• Gli utenti trovano la documentazione tecnica tramite la ricerca del forum
• Nessuna necessità di duplicare i contenuti (post del forum + caricamento RAG)
• Migliore SEO (PDF allegati ad argomenti indicizzati)
• Architettura più semplice (il comando di ricerca funziona e basta)

Se dovessi implementare questo, potrei potenzialmente:

  1. Rimuovere gli strumenti forzati (la ricerca troverebbe naturalmente i contenuti dei PDF)
  2. Eliminare completamente i caricamenti RAG (tutto negli argomenti del forum)
  3. Semplificare significativamente il sistema
1 Mi Piace

C’è un argomento simile sull’indicizzazione dei file per ai-search qui: Index File Contents for Search

1 Mi Piace

Penso che un plugin potrebbe aggiungere il testo all’interno del post elaborato in un elemento dettagli nascosto opzionalmente. Questo lo aggiungerebbe in modo che possa essere trovato, credo. Se sei auto-ospitato, penso che costerebbe solo poche centinaia di dollari per farlo sviluppare. Oppure, se sembra che siano interessati, potrebbe essere inviato come PR, per circa il doppio (per includere test e simili).