Permettre au ChatBot de lire des PDF pour qu'il puisse participer à une discussion de groupe

EricGT · Août 29, 2023, 12:47

Pour ceux qui ont accès à des outils permettant de discuter avec un ou plusieurs PDF, il serait intéressant que le Bot IA de Discourse puisse également lire des PDF et participer à la discussion.

Pour l’instant, les universitaires s’en régalent, mais je ne connais aucun moyen pour qu’un groupe d’utilisateurs rejoigne le bot en tant que groupe pour discuter de l’article. À ma connaissance, on ne peut que discuter seul avec le bot qui a lu l’article. Je suis sûr que des discussions de groupe sur des articles existent, mais Discourse devrait aussi l’avoir.

Imaginez un club de lecture avec un bot invité et la discussion portant sur un ou plusieurs articles (PDF).

Si quelqu’un a la brillante idée que Discourse + plugins de modèles IA (ref) = , j’espère que c’est ici que vous le lirez en premier.

Au fur et à mesure que de plus en plus de plugins et de bots différents sont créés, on pourrait éventuellement former un groupe de musique, , organiser une rencontre virtuelle de programmeurs , etc.

merefield · Août 29, 2023, 2:47

En ce qui concerne https://meta.discourse.org/t/discourse-chatbot-now-smarter-than-chatgpt/256552?u=merefield, les PR sont les bienvenus.

N’importe qui est libre de me contacter s’il souhaite sponsoriser ce travail.

Le framework que j’ai créé est facilement extensible et la lecture de PDF serait un excellent ajout.

sam · Août 31, 2023, 12:39

Il faudra des personas dédiés pour ce type de travail, je pense que c’est faisable, on découpe et on intègre, puis on peut en discuter. Mais je ne suis pas sûr que je mélangerais cela avec un « Forum Helper »… peut-être un persona « Document Explorer ».

Cas d’utilisation très intéressant et étant donné que nous avons une grande partie de l’infrastructure pour télécharger des documents, etc., ce n’est pas trop difficile à construire.

Falco · Août 31, 2023, 1:46

Est-ce que cela extrait du texte du fichier et l’injecte dans l’invite ? Cela ressemble à une fonctionnalité intéressante si c’est le cas.

EricGT · Août 31, 2023, 2:05

Tout d’abord, je n’ai créé aucun de ceux-ci, je ne peux donc que spéculer.

Oui.

Les quelques plugins ChatGPT que j’ai essayés lisent l’intégralité du PDF, mais beaucoup ne lisent que le texte car l’extraction de données à partir d’expressions mathématiques et de graphiques dépasse leurs capacités. Cela est dû au fait qu’un PDF est conçu pour la mise en page et la présentation, et non pour l’extraction de contexte ou la transmission de connaissances en tant que format d’échange de données.

Je ne suis pas sûr de ce que vous entendez par là, mais d’après ce que je comprends, ils intègrent les connaissances dans une base de données vectorielle, puis utilisent le prompt pour extraire les parties pertinentes et composer une réponse.

L’analogie que j’utilise pour expliquer à d’autres comment comprendre le concept est, au lieu de se concentrer sur l’idée d’un PDF, de penser aux idées que les auteurs de l’article essaient de transmettre dans l’article et que vous conversez avec eux.

Si vous pouvez exécuter des plugins avec ChatGPT, alors sur ce site
https://pugin.ai/
recherchez PDF ou paper et essayez-en. Les deux principales différences que je trouve est que beaucoup liront un seul PDF, (https://pugin.ai/p/chatwithpdf) tandis que celui-ci (https://pugin.ai/p/science) sélectionnera les articles pertinents parmi 250 millions d’articles scientifiques.

LangChain a ceci

et il existe des dépôts similaires sur GitHub (ref), YMMV.

Voici un cas d’utilisation spécifique pour une telle technologie pour ceux qui pensent qu’elle serait limitée aux universitaires.

Exploiter les LLM avec de vastes ensembles de données et guides mécaniques

merefield · Août 31, 2023, 3:12

Quelle étrangeté de mettre un numéro de modèle dans le nom d’un dépôt ! Pourquoi cela ne fonctionnerait-il pas avec 3.5 ?

EricGT · Octobre 12, 2023, 10:21

Pour information

D’autres personnes se lancent également dans des idées similaires.

Sujet		Réponses	Vues
Using PDF and attachment support with AI bots Site Management how-to , ai , ai-bot	0	348	Décembre 11, 2025
PDF support in Discourse AI (RAG) Site Management how-to , ai	20	1094	Décembre 5, 2025
Native PDF and attachment support in Discourse AI Announcements ai	0	124	Décembre 11, 2025
Will RAG Support PDF Files in the Future? Feature completed , ai , ai-bot	21	783	Mars 11, 2025
[Ai Bot] Add user token tracking, custom AI personas, max context posts, document loading, custom API URLs, and localized chat titles Feature ai , ai-bot	1	616	Mars 22, 2024

Permettre au ChatBot de lire des PDF pour qu'il puisse participer à une discussion de groupe

Sujets connexes