ChatBotがPDFを読み込めるようにして、グループディスカッションに参加できるようにする

PDFとチャットできるツールにアクセスできる方にとって、Discourse AI - AI Bot も PDF を読み込み、議論に参加できれば素晴らしいでしょう。


現在、学術関係者はこれを熱心に利用していますが、ユーザーグループがボットと一緒に論文について話し合う方法がわかりません。私の知る限り、論文を読んだボットと一人でチャットすることしかできません。論文とのグループチャットは存在すると思いますが、Discourse にも必要です。

ボットを招待したブッククラブのようなもので、議論は1つ以上の論文(PDF)について行われると考えてください。



誰かが「Discourse + AI モデルプラグイン (ref) = :moneybag:」という素晴らしいアイデアを思いついた場合、これを最初に読んだことを願っています。

ますます多くの異なるプラグインやボットが作成されるにつれて、最終的にはガレージバンドを組んだり (:guitar:)、仮想プログラマーの集まりをしたり (:desktop_computer:) できるようになるでしょう。



「いいね!」 3

Discourse Chatbot 🤖 に関しては、PR を歓迎します。

この作業のスポンサーになりたい方は、いつでも私に連絡してください。

私が作成したフレームワークは簡単に拡張でき、PDF の読み取りは素晴らしい追加機能になるでしょう。:+1:

「いいね!」 3

この種の作業には専用のペルソナが必要になるでしょう。チャンク化して埋め込み、それと議論することは可能だと思います。しかし、「フォーラムヘルパー」とこれを混在させるかどうかはわかりません…「ドキュメントエクスプローラー」のペルソナの方が良いかもしれません。

非常に興味深いユースケースであり、ドキュメントなどをアップロードするためのインフラが大量にあることを考えると、構築するのはそれほど無理なことではありません。

「いいね!」 3

これはファイルからテキストを抽出し、プロンプトに挿入しているのでしょうか?もしそうなら、興味深い機能のように聞こえます。

まず、私はこれらのいずれも作成していないため、推測しかできません。

はい。
私が試したいくつかのChatGPTプラグインはPDF全体を読み込みますが、多くは数式やグラフからデータを抽出しようとすると、その能力を超えています。これは、PDFがレイアウトとプレゼンテーションのために設計されており、コンテキスト抽出や知識をデータ交換フォーマットとして渡すためではないからです。

それが具体的に何を意味するのかはわかりませんが、私の理解では、知識をベクトルデータベースに埋め込み、プロンプトを使用して関連部分を抽出し、応答を生成しています。
他の人に概念を理解してもらうために使う例えは、PDFという考え方に焦点を当てるのではなく、論文の著者たちが論文で伝えようとしている考え方に焦点を当て、著者たちと会話していると考えることです。

ChatGPTでプラグインを実行できる場合は、このサイトで
https://pugin.ai/
PDFまたはpaperを検索していくつか試してみてください。それらの主な違いは、多くが単一のPDFを読み込むのに対し(https://pugin.ai/p/chatwithpdf)、これは2億5000万件の科学論文から関連論文を選択します(https://pugin.ai/p/science)。


LangChainにはこれがあります

GitHubには同様のリポジトリがあります(参照)、結果は異なる場合があります。


学術的なものに限定されると考えている人々のために、このような技術の具体的なユースケースを以下に示します。

膨大な機械データセットとガイドでLLMを活用する

「いいね!」 1

リポジトリ名にモデル番号を入れるなんて、なんて奇妙なんだろう!なぜ3.5では動作しないのだろうか?

参考情報です。

他の企業も同様のアイデアを取り入れています。

「いいね!」 1