Pour ceux qui ont accès à des outils permettant de discuter avec un ou plusieurs PDF, il serait intéressant que le Bot IA de Discourse puisse également lire des PDF et participer à la discussion.
Pour l’instant, les universitaires s’en régalent, mais je ne connais aucun moyen pour qu’un groupe d’utilisateurs rejoigne le bot en tant que groupe pour discuter de l’article. À ma connaissance, on ne peut que discuter seul avec le bot qui a lu l’article. Je suis sûr que des discussions de groupe sur des articles existent, mais Discourse devrait aussi l’avoir.
Imaginez un club de lecture avec un bot invité et la discussion portant sur un ou plusieurs articles (PDF).
Si quelqu’un a la brillante idée que Discourse + plugins de modèles IA (ref) = , j’espère que c’est ici que vous le lirez en premier.
Au fur et à mesure que de plus en plus de plugins et de bots différents sont créés, on pourrait éventuellement former un groupe de musique, , organiser une rencontre virtuelle de programmeurs , etc.
Il faudra des personas dédiés pour ce type de travail, je pense que c’est faisable, on découpe et on intègre, puis on peut en discuter. Mais je ne suis pas sûr que je mélangerais cela avec un « Forum Helper »… peut-être un persona « Document Explorer ».
Cas d’utilisation très intéressant et étant donné que nous avons une grande partie de l’infrastructure pour télécharger des documents, etc., ce n’est pas trop difficile à construire.
Tout d’abord, je n’ai créé aucun de ceux-ci, je ne peux donc que spéculer.
Oui.
Les quelques plugins ChatGPT que j’ai essayés lisent l’intégralité du PDF, mais beaucoup ne lisent que le texte car l’extraction de données à partir d’expressions mathématiques et de graphiques dépasse leurs capacités. Cela est dû au fait qu’un PDF est conçu pour la mise en page et la présentation, et non pour l’extraction de contexte ou la transmission de connaissances en tant que format d’échange de données.
Je ne suis pas sûr de ce que vous entendez par là, mais d’après ce que je comprends, ils intègrent les connaissances dans une base de données vectorielle, puis utilisent le prompt pour extraire les parties pertinentes et composer une réponse.
L’analogie que j’utilise pour expliquer à d’autres comment comprendre le concept est, au lieu de se concentrer sur l’idée d’un PDF, de penser aux idées que les auteurs de l’article essaient de transmettre dans l’article et que vous conversez avec eux.
Si vous pouvez exécuter des plugins avec ChatGPT, alors sur ce site https://pugin.ai/
recherchez PDF ou paper et essayez-en. Les deux principales différences que je trouve est que beaucoup liront un seul PDF, (https://pugin.ai/p/chatwithpdf) tandis que celui-ci (https://pugin.ai/p/science) sélectionnera les articles pertinents parmi 250 millions d’articles scientifiques.
LangChain a ceci
et il existe des dépôts similaires sur GitHub (ref), YMMV.
Voici un cas d’utilisation spécifique pour une telle technologie pour ceux qui pensent qu’elle serait limitée aux universitaires.