Limitação atual:
• A pesquisa semântica do fórum indexa apenas o texto das postagens, não os anexos em PDF
• Arquivos PDF não são pesquisáveis através da opção de alternância de IA /search
• Para contornar isso, tive que carregar manualmente os PDFs separadamente para o RAG da persona
Solução proposta:
• Extrair texto de anexos PDF durante a geração de incorporação (embedding)
• Indexar o conteúdo do PDF juntamente com o texto da postagem
• Tornar os tópicos com anexos PDF detectáveis através da pesquisa semântica
Benefícios:
• Usuários encontram documentação técnica através da pesquisa do fórum
• Não há necessidade de duplicar conteúdo (postagem do fórum + upload no RAG)
• Melhor SEO (PDFs anexados a tópicos indexados)
• Arquitetura mais simples (o comando de pesquisa simplesmente funciona)
Se você implementasse isso, eu poderia potencialmente:
- Remover ferramentas forçadas (a pesquisa encontraria o conteúdo do PDF naturalmente)
- Eliminar totalmente os uploads de RAG (tudo nos tópicos do fórum)
- Simplificar significativamente o sistema