允许聊天机器人读取PDF文件,以便加入小组讨论

对于那些可以使用工具与 PDF 文档进行聊天的人来说,如果 Discourse AI - AI Bot 也能阅读 PDF 文档并参与讨论,那就太好了。


现在学者们对此趋之若鹜,但我不知道有什么方法可以让一群用户作为一个团队与机器人一起讨论论文。据我所知,你只能独自与阅读了论文的机器人聊天。我敢肯定,关于论文的小组聊天是存在的,但 Discourse 也应该有。

想象一下,就像一个读书俱乐部,邀请了一个机器人,讨论是关于一篇或多篇论文(PDF)。



如果有人有了这个绝妙的主意 :star2:,即 Discourse + AI 模型插件 (ref) = :moneybag:,希望这是你看到它的第一个地方。

随着越来越多的不同插件和机器人的创建,最终可以组建一个车库乐队 :guitar:,举办一次虚拟程序员聚会 :desktop_computer: 等等。



3 个赞

Discourse Chatbot 🤖 而言,欢迎提交拉取请求。

任何人都可以联系我,如果他们想赞助这项工作。

我创建的框架易于扩展,阅读 PDF 将是一个很棒的补充。 :+1:

3 个赞

我認為這項工作需要專門的用戶畫像,我認為這是可行的,你可以將其分塊並嵌入,然後與之討論。但我不確定我是否會將其與「論壇助手」混合……也許是一個「文檔瀏覽器」用戶畫像。

這是一個非常有趣的用例,而且由於我們有大量的基礎設施來上傳文檔等,所以構建它並不過分牽強。

3 个赞

这是否会从文件中提取文本并将其注入提示中?如果是这样,这听起来像是一个有趣的功能。

首先,我没有创建其中任何一个,所以只能猜测。

是的。
我尝试过的少数 ChatGPT 插件会读取整个 PDF,但许多插件只能读取文本,因为从数学表达式和图形中提取数据超出了它们的能力。这是因为 PDF 的设计是为了布局和呈现,而不是为了提取上下文或将知识作为数据交换格式传递。

我不确定您确切的意思,但据我所知,它们会将知识嵌入到向量数据库中,然后使用提示来挑选相关部分并组合回复。
我用来向他人解释这个概念的比喻是,不要关注 PDF 的想法,而是关注作者在论文中试图传达的想法,并且您正在与他们交谈。

如果您可以在 ChatGPT 中运行插件,那么在这个网站上
https://pugin.ai/
搜索 PDFpaper 并尝试一些。我发现它们之间的两个主要区别是,许多插件会读取单个 PDF(https://pugin.ai/p/chatwithpdf),而这个插件(https://pugin.ai/p/science)将从 2.5 亿篇科学论文中挑选出相关的论文。


LangChain 有这个

并且 GitHub 上有类似的仓库(参考),您的体验可能会有所不同。


对于那些认为此类技术仅限于学术界的人来说,这里有一个具体的用例。

利用具有海量机械数据集和指南的 LLM

1 个赞

在仓库名称中放入模型号真是奇怪!为什么它不能与 3.5 一起使用?

供参考

其他人也在尝试类似的想法。

1 个赞