Chatbot soll PDFs lesen können, um an Gruppendiskussionen teilzunehmen

EricGT · 29. August 2023 um 12:47

Für diejenigen, die Zugang zu Werkzeugen haben, mit denen man PDFs durchsuchen kann, wäre es schön, wenn der Discourse AI - AI Bot auch PDFs lesen und sich an der Diskussion beteiligen könnte.

Im Moment stürzen sich die Akademiker darauf wie auf Süßigkeiten, aber ich kenne keine Möglichkeit, wie eine Gruppe von Benutzern als Gruppe mit dem Bot beitreten kann, um über die Arbeit(en) zu sprechen. Soweit ich weiß, kann man nur alleine mit dem Bot chatten, der die Arbeit gelesen hat. Ich bin sicher, dass Gruppengespräche mit Arbeit(en) existieren, aber Discourse sollte es auch haben.

Stellen Sie es sich wie einen Buchclub vor, zu dem ein Bot eingeladen wurde und die Diskussion sich um eine oder mehrere Arbeiten (PDFs) dreht.

Wenn jemand auf die glorreiche Idee kommt , dass Discourse + KI-Modell-Plugins (ref) = , hoffe ich, dass Sie dies als erster lesen.

Da immer mehr verschiedene Plugins und Bots erstellt werden, könnte man schließlich eine Garagenband gründen , ein virtuelles Programmierertreffen abhalten usw.

merefield · 29. August 2023 um 14:47

Was Discourse Chatbot 🤖 betrifft, ist ein PR willkommen.

Jeder kann mich kontaktieren, wenn er diese Arbeit sponsern möchte.

Das von mir erstellte Framework ist leicht erweiterbar und das Lesen von PDFs wäre eine großartige Ergänzung.

sam · 31. August 2023 um 00:39

Für diese Art von Arbeit werden dedizierte Personas benötigt. Ich denke, es ist machbar, man zerlegt und bettet ein und kann dann damit diskutieren. Aber ich bin mir nicht sicher, ob ich das mit „Forum-Helfer“ vermischen würde … vielleicht eine „Dokumenten-Explorer“-Persona.

Sehr interessanter Anwendungsfall, und da wir so viel Infrastruktur zum Hochladen von Dokumenten usw. haben, ist es keine allzu große Anstrengung, dies zu realisieren.

Falco · 31. August 2023 um 13:46

Extrahiert dies Text aus der Datei und fügt ihn in den Prompt ein? Klingt nach einer interessanten Funktion, wenn ja.

EricGT · 31. August 2023 um 14:05

Zunächst einmal habe ich keines davon erstellt und kann daher nur spekulieren.

Ja.

Die wenigen ChatGPT-Plugins, die ich ausprobiert habe, lesen die gesamte PDF-Datei, aber viele lesen nur den Text, da die Extraktion von Daten aus mathematischen Ausdrücken und Grafiken über ihre Fähigkeiten hinausgeht. Dies liegt daran, dass ein PDF für Layout und Präsentation konzipiert ist und nicht für die Kontextextraktion oder die Weitergabe von Wissen als Datenaustauschformat.

Ich bin mir nicht sicher, was Sie damit genau meinen, aber soweit ich weiß, betten sie das Wissen in eine Vektordatenbank ein und verwenden dann den Prompt, um die relevanten Teile herauszufiltern und eine Antwort zu verfassen.
Die Analogie, die ich verwende, um anderen das Konzept zu erklären, ist, sich nicht auf die Idee eines PDFs zu konzentrieren, sondern stattdessen auf die Ideen, die der oder die Autoren des Papiers in dem Papier vermitteln wollen, und dass Sie mit ihnen sprechen.

Wenn Sie Plugins mit ChatGPT ausführen können, dann auf dieser Seite
https://pugin.ai/
suchen Sie nach PDF oder paper und probieren Sie einige aus. Die beiden Hauptunterschiede, die ich bei ihnen feststelle, sind, dass viele eine einzelne PDF-Datei lesen (https://pugin.ai/p/chatwithpdf), während diese hier (https://pugin.ai/p/science) die relevanten Papiere aus 250 Millionen wissenschaftlichen Arbeiten auswählt.

LangChain hat dies

und es gibt ähnliche Repos auf GitHub (ref), YMMV.

Hier ist ein spezifischer Anwendungsfall für eine solche Technologie für diejenigen, die denken, dass sie auf Akademiker beschränkt wäre.

Nutzung von LLMs mit riesigen mechanischen Datensätzen und Anleitungen

merefield · 31. August 2023 um 15:12

Wie seltsam, eine Modellnummer in einem Repository-Namen zu verwenden! Warum sollte es nicht mit 3.5 funktionieren?

EricGT · 12. Oktober 2023 um 22:21

Zur Information

Auch andere springen auf ähnliche Ideen auf.

Thema		Antworten	Aufrufe
Using PDF and attachment support with AI bots Site Management how-to , ai , ai-bot	0	331	11. Dezember 2025
PDF support in Discourse AI (RAG) Site Management how-to , ai	20	1086	5. Dezember 2025
Native PDF and attachment support in Discourse AI Announcements ai	0	124	11. Dezember 2025
Will RAG Support PDF Files in the Future? Feature completed , ai , ai-bot	21	781	11. März 2025
[Ai Bot] Add user token tracking, custom AI personas, max context posts, document loading, custom API URLs, and localized chat titles Feature ai , ai-bot	1	616	22. März 2024

Chatbot soll PDFs lesen können, um an Gruppendiskussionen teilzunehmen

Verwandte Themen