Por favor, por favor, adicione suporte para pesquisar arquivos pdf nos tópicos do fórum a partir de personas de IA - sem ter que carregá-los separadamente!

Limitação atual:
• A pesquisa semântica do fórum indexa apenas o texto das postagens, não os anexos em PDF
• Arquivos PDF não são pesquisáveis através da opção de alternância de IA /search
• Para contornar isso, tive que carregar manualmente os PDFs separadamente para o RAG da persona

Solução proposta:
• Extrair texto de anexos PDF durante a geração de incorporação (embedding)
• Indexar o conteúdo do PDF juntamente com o texto da postagem
• Tornar os tópicos com anexos PDF detectáveis através da pesquisa semântica

Benefícios:
• Usuários encontram documentação técnica através da pesquisa do fórum
• Não há necessidade de duplicar conteúdo (postagem do fórum + upload no RAG)
• Melhor SEO (PDFs anexados a tópicos indexados)
• Arquitetura mais simples (o comando de pesquisa simplesmente funciona)

Se você implementasse isso, eu poderia potencialmente:

  1. Remover ferramentas forçadas (a pesquisa encontraria o conteúdo do PDF naturalmente)
  2. Eliminar totalmente os uploads de RAG (tudo nos tópicos do fórum)
  3. Simplificar significativamente o sistema
1 curtida

Há um tópico semelhante sobre indexação de arquivos para ai-search aqui: Index File Contents for Search