Permitir que o ChatBot leia PDFs para participar de discussões em grupo

EricGT · Agosto 29, 2023, 12:47pm

Para aqueles que têm acesso a ferramentas que permitem conversar com um PDF(s), seria bom se o Discourse AI - AI Bot também pudesse ler PDFs e participar da discussão.

No momento, os acadêmicos estão adorando isso, mas não conheço uma maneira de um grupo de usuários participar em grupo com o bot para conversar sobre o(s) artigo(s). Pelo que sei, só se pode conversar sozinho com o bot que leu o artigo. Tenho certeza de que chats em grupo com artigos existem, mas o Discourse também deveria ter.

Pense nisso como um clube do livro com um bot convidado e a discussão sendo sobre um ou mais artigos (PDFs).

Se alguém tiver a ideia brilhante de que Discourse + plugins de modelo de IA (ref) = , espero que este seja o primeiro lugar onde você leia isso.

À medida que mais e mais plugins e bots diferentes são criados, eventualmente se poderia formar uma banda de garagem, , ter um encontro virtual de programadores , etc.

merefield · Agosto 29, 2023, 2:47pm

Quanto a Discourse Chatbot 🤖, PRs são bem-vindos.

Qualquer pessoa é livre para me contatar se quiser patrocinar esse trabalho.

O framework que criei é facilmente extensível e a leitura de PDFs seria uma ótima adição.

sam · Agosto 31, 2023, 12:39am

Vou precisar de personas dedicadas para esse tipo de trabalho, acho que é factível, você divide em blocos e incorpora e então pode discutir com isso. Mas não tenho certeza se misturaria isso com o “Ajuda de Fórum”… talvez uma persona de “Explorador de Documentos”.

Caso de uso muito interessante e, como temos muita infraestrutura para fazer upload de documentos, etc., não é um grande esforço para construir.

Falco · Agosto 31, 2023, 1:46pm

Isso está extraindo texto do arquivo e injetando-o no prompt? Parece um recurso interessante, se for o caso.

EricGT · Agosto 31, 2023, 2:05pm

Em primeiro lugar, não criei nenhum deles, então só posso especular.

Sim.

Os poucos plugins do ChatGPT que experimentei leem o PDF inteiro, no entanto, muitos leem apenas o texto, pois extrair dados de expressões matemáticas e gráficos está além de sua capacidade. Isso ocorre porque um PDF é projetado para layout e apresentação, e não para extração de contexto ou para transmitir conhecimento como um formato de intercâmbio de dados.

Não tenho certeza do que você quer dizer com isso, mas, pelo que entendi, eles incorporam o conhecimento em um banco de dados vetorial e, em seguida, usam o prompt para selecionar as partes relevantes e compor uma resposta.
A analogia que uso para explicar a outras pessoas como entender o conceito é, em vez de focar na ideia de um PDF, pensar nas ideias que os autores do artigo estão tentando transmitir no artigo e que você está conversando com eles.

Se você puder executar plugins com o ChatGPT, neste site
https://pugin.ai/
pesquise por PDF ou paper e experimente alguns. As duas principais diferenças que encontro neles é que muitos lerão um único PDF (https://pugin.ai/p/chatwithpdf), enquanto este (https://pugin.ai/p/science) selecionará os artigos relevantes de 250 milhões de artigos científicos.

O LangChain tem isso

e existem repositórios semelhantes no GitHub (ref), sua experiência pode variar.

Aqui está um caso de uso específico para tal tecnologia para aqueles que pensam que ela se limitaria apenas a acadêmicos.

Aproveitando LLMs com Vastos Conjuntos de Dados e Guias de Mecânica

merefield · Agosto 31, 2023, 3:12pm

Que estranho colocar um número de modelo no nome de um repositório! Por que não funcionaria com o 3.5?

EricGT · Outubro 12, 2023, 10:21pm

FYI

Outros também estão aderindo a ideias semelhantes.

Tópico		Respostas	Visualizações
Using PDF and attachment support with AI bots Site Management how-to , ai , ai-bot	0	348	11 de Dezembro de 2025
PDF support in Discourse AI (RAG) Site Management how-to , ai	20	1097	5 de Dezembro de 2025
Native PDF and attachment support in Discourse AI Announcements ai	0	124	11 de Dezembro de 2025
Will RAG Support PDF Files in the Future? Feature completed , ai , ai-bot	21	783	11 de Março de 2025
[Ai Bot] Add user token tracking, custom AI personas, max context posts, document loading, custom API URLs, and localized chat titles Feature ai , ai-bot	1	616	22 de Março de 2024

Permitir que o ChatBot leia PDFs para participar de discussões em grupo

Tópicos relacionados