Permitir que o ChatBot leia PDFs para participar de discussões em grupo

Para aqueles que têm acesso a ferramentas que permitem conversar com um PDF(s), seria bom se o Discourse AI - AI Bot também pudesse ler PDFs e participar da discussão.


No momento, os acadêmicos estão adorando isso, mas não conheço uma maneira de um grupo de usuários participar em grupo com o bot para conversar sobre o(s) artigo(s). Pelo que sei, só se pode conversar sozinho com o bot que leu o artigo. Tenho certeza de que chats em grupo com artigos existem, mas o Discourse também deveria ter.

Pense nisso como um clube do livro com um bot convidado e a discussão sendo sobre um ou mais artigos (PDFs).



Se alguém tiver a ideia brilhante :star2: de que Discourse + plugins de modelo de IA (ref) = :moneybag:, espero que este seja o primeiro lugar onde você leia isso.

À medida que mais e mais plugins e bots diferentes são criados, eventualmente se poderia formar uma banda de garagem, :guitar:, ter um encontro virtual de programadores :desktop_computer:, etc.



3 curtidas

Quanto a Discourse Chatbot 🤖, PRs são bem-vindos.

Qualquer pessoa é livre para me contatar se quiser patrocinar esse trabalho.

O framework que criei é facilmente extensível e a leitura de PDFs seria uma ótima adição. :+1:

3 curtidas

Vou precisar de personas dedicadas para esse tipo de trabalho, acho que é factível, você divide em blocos e incorpora e então pode discutir com isso. Mas não tenho certeza se misturaria isso com o “Ajuda de Fórum”… talvez uma persona de “Explorador de Documentos”.

Caso de uso muito interessante e, como temos muita infraestrutura para fazer upload de documentos, etc., não é um grande esforço para construir.

3 curtidas

Isso está extraindo texto do arquivo e injetando-o no prompt? Parece um recurso interessante, se for o caso.

Em primeiro lugar, não criei nenhum deles, então só posso especular.

Sim.

Os poucos plugins do ChatGPT que experimentei leem o PDF inteiro, no entanto, muitos leem apenas o texto, pois extrair dados de expressões matemáticas e gráficos está além de sua capacidade. Isso ocorre porque um PDF é projetado para layout e apresentação, e não para extração de contexto ou para transmitir conhecimento como um formato de intercâmbio de dados.

Não tenho certeza do que você quer dizer com isso, mas, pelo que entendi, eles incorporam o conhecimento em um banco de dados vetorial e, em seguida, usam o prompt para selecionar as partes relevantes e compor uma resposta.
A analogia que uso para explicar a outras pessoas como entender o conceito é, em vez de focar na ideia de um PDF, pensar nas ideias que os autores do artigo estão tentando transmitir no artigo e que você está conversando com eles.

Se você puder executar plugins com o ChatGPT, neste site
https://pugin.ai/
pesquise por PDF ou paper e experimente alguns. As duas principais diferenças que encontro neles é que muitos lerão um único PDF (https://pugin.ai/p/chatwithpdf), enquanto este (https://pugin.ai/p/science) selecionará os artigos relevantes de 250 milhões de artigos científicos.


O LangChain tem isso

e existem repositórios semelhantes no GitHub (ref), sua experiência pode variar.


Aqui está um caso de uso específico para tal tecnologia para aqueles que pensam que ela se limitaria apenas a acadêmicos.

Aproveitando LLMs com Vastos Conjuntos de Dados e Guias de Mecânica

1 curtida

Que estranho colocar um número de modelo no nome de um repositório! Por que não funcionaria com o 3.5?

FYI

Outros também estão aderindo a ideias semelhantes.

1 curtida