GPT-4 支持视觉功能

tpetrov · 2024 年2 月 15 日 11:32

在 AI 插件设置中，我可以看到这个可启用的 AI 机器人列表：

我想知道 gpt-4-turbo 机器人是“gpt-4-turbo-preview”还是“gpt-4-vision-preview”。
也就是说，它有视觉能力吗？
如果它是“gpt-4-turbo-preview”，是否也会添加视觉能力？我认为这会很有用，因为例如截图可以帮助机器人理解用户的查询。

Jagster · 2024 年2 月 15 日 11:39

我不知道答案，但 Vision 与 4 相同，它有很多问题，可能会有问题。但据我所知，应该有一个 Vision 的独立模型，并且 Discourse 不使用自己的命名风格。

merefield · 2024 年2 月 15 日 11:40

FYI 此功能在 Discourse Chatbot 🤖 中受支持（适用于“基本”模式）

Jagster · 2024 年2 月 15 日 11:42

（没有 RAG 会让它有点无力；否则它会带来很多乐趣）

merefield · 2024 年2 月 15 日 11:42

请致电 Sam Altman ，他需要为视觉模型添加功能。

sam · 2024 年2 月 15 日 22:08

目前 gpt-4-turbo == gpt-4-0125-preview，即没有视觉功能。

@keegan 正在探索一些视觉集成：

特别是通过视觉 API（包括开放和闭源模型）为图像添加字幕。

我真的很喜欢……通过与机器人开始私信、上传图像并询问相关信息这种“演示”能力，但需要考虑流程，因为我们需要在模型之间切换。

也许“自动工具”的概念在这里可行，所以如果我们看到上传，我们会自动路由到工具，然后再回到主模型……我会考虑一下。

在技术上，在我们的架构中连接这个功能并不复杂。

tpetrov · 2024 年2 月 16 日 08:48

谢谢 Sam！

Vision 和 turbo 应该基本相同（但不确定，还没有经过彻底测试）。

话题		回复	浏览量
Adding a picture questions feature Feature ai	3	837	2024 年1 月 12 日
Discourse Chatbot :robot: Plugin ai	215	35005	2026 年3 月 7 日
Ai plugin ocr support Feature ai	11	966	2024 年4 月 2 日
Helper - captioning images Site Management how-to , ai , ai-captions	9	469	2025 年9 月 2 日
Issue with AI bots forum bots Support ai , ai-bot	5	129	2026 年4 月 1 日