Chatbot soll PDFs lesen können, um an Gruppendiskussionen teilzunehmen

Für diejenigen, die Zugang zu Werkzeugen haben, mit denen man PDFs durchsuchen kann, wäre es schön, wenn der Discourse AI - AI Bot auch PDFs lesen und sich an der Diskussion beteiligen könnte.


Im Moment stürzen sich die Akademiker darauf wie auf Süßigkeiten, aber ich kenne keine Möglichkeit, wie eine Gruppe von Benutzern als Gruppe mit dem Bot beitreten kann, um über die Arbeit(en) zu sprechen. Soweit ich weiß, kann man nur alleine mit dem Bot chatten, der die Arbeit gelesen hat. Ich bin sicher, dass Gruppengespräche mit Arbeit(en) existieren, aber Discourse sollte es auch haben.

Stellen Sie es sich wie einen Buchclub vor, zu dem ein Bot eingeladen wurde und die Diskussion sich um eine oder mehrere Arbeiten (PDFs) dreht.



Wenn jemand auf die glorreiche Idee kommt :star2:, dass Discourse + KI-Modell-Plugins (ref) = :moneybag:, hoffe ich, dass Sie dies als erster lesen.

Da immer mehr verschiedene Plugins und Bots erstellt werden, könnte man schließlich eine Garagenband gründen :guitar:, ein virtuelles Programmierertreffen abhalten :desktop_computer: usw.



3 „Gefällt mir“

Was Discourse Chatbot 🤖 betrifft, ist ein PR willkommen.

Jeder kann mich kontaktieren, wenn er diese Arbeit sponsern möchte.

Das von mir erstellte Framework ist leicht erweiterbar und das Lesen von PDFs wäre eine großartige Ergänzung. :+1:

3 „Gefällt mir“

Für diese Art von Arbeit werden dedizierte Personas benötigt. Ich denke, es ist machbar, man zerlegt und bettet ein und kann dann damit diskutieren. Aber ich bin mir nicht sicher, ob ich das mit „Forum-Helfer“ vermischen würde … vielleicht eine „Dokumenten-Explorer“-Persona.

Sehr interessanter Anwendungsfall, und da wir so viel Infrastruktur zum Hochladen von Dokumenten usw. haben, ist es keine allzu große Anstrengung, dies zu realisieren.

3 „Gefällt mir“

Extrahiert dies Text aus der Datei und fügt ihn in den Prompt ein? Klingt nach einer interessanten Funktion, wenn ja.

Zunächst einmal habe ich keines davon erstellt und kann daher nur spekulieren.

Ja.

Die wenigen ChatGPT-Plugins, die ich ausprobiert habe, lesen die gesamte PDF-Datei, aber viele lesen nur den Text, da die Extraktion von Daten aus mathematischen Ausdrücken und Grafiken über ihre Fähigkeiten hinausgeht. Dies liegt daran, dass ein PDF für Layout und Präsentation konzipiert ist und nicht für die Kontextextraktion oder die Weitergabe von Wissen als Datenaustauschformat.

Ich bin mir nicht sicher, was Sie damit genau meinen, aber soweit ich weiß, betten sie das Wissen in eine Vektordatenbank ein und verwenden dann den Prompt, um die relevanten Teile herauszufiltern und eine Antwort zu verfassen.
Die Analogie, die ich verwende, um anderen das Konzept zu erklären, ist, sich nicht auf die Idee eines PDFs zu konzentrieren, sondern stattdessen auf die Ideen, die der oder die Autoren des Papiers in dem Papier vermitteln wollen, und dass Sie mit ihnen sprechen.

Wenn Sie Plugins mit ChatGPT ausführen können, dann auf dieser Seite
https://pugin.ai/
suchen Sie nach PDF oder paper und probieren Sie einige aus. Die beiden Hauptunterschiede, die ich bei ihnen feststelle, sind, dass viele eine einzelne PDF-Datei lesen (https://pugin.ai/p/chatwithpdf), während diese hier (https://pugin.ai/p/science) die relevanten Papiere aus 250 Millionen wissenschaftlichen Arbeiten auswählt.


LangChain hat dies

und es gibt ähnliche Repos auf GitHub (ref), YMMV.


Hier ist ein spezifischer Anwendungsfall für eine solche Technologie für diejenigen, die denken, dass sie auf Akademiker beschränkt wäre.

Nutzung von LLMs mit riesigen mechanischen Datensätzen und Anleitungen

1 „Gefällt mir“

Wie seltsam, eine Modellnummer in einem Repository-Namen zu verwenden! Warum sollte es nicht mit 3.5 funktionieren?

Zur Information

Auch andere springen auf ähnliche Ideen auf.

1 „Gefällt mir“