GPT-4 支持视觉功能

在 AI 插件设置中,我可以看到这个可启用的 AI 机器人列表:


我想知道 gpt-4-turbo 机器人是“gpt-4-turbo-preview”还是“gpt-4-vision-preview”。
也就是说,它有视觉能力吗?
如果它是“gpt-4-turbo-preview”,是否也会添加视觉能力?我认为这会很有用,因为例如截图可以帮助机器人理解用户的查询。

我不知道答案,但 Vision 与 4 相同,它有很多问题,可能会有问题。但据我所知,应该有一个 Vision 的独立模型,并且 Discourse 不使用自己的命名风格。

FYI 此功能在 Discourse Chatbot 🤖 中受支持(适用于“基本”模式)

1 个赞

(没有 RAG 会让它有点无力;否则它会带来很多乐趣)

2 个赞

请致电 Sam Altman :phone: ,他需要为视觉模型添加功能。

3 个赞

目前 gpt-4-turbo == gpt-4-0125-preview,即没有视觉功能。

@keegan 正在探索一些视觉集成:

特别是通过视觉 API(包括开放和闭源模型)为图像添加字幕。

我真的很喜欢……通过与机器人开始私信、上传图像并询问相关信息这种“演示”能力,但需要考虑流程,因为我们需要在模型之间切换。

也许“自动工具”的概念在这里可行,所以如果我们看到上传,我们会自动路由到工具,然后再回到主模型……我会考虑一下。

在技术上,在我们的架构中连接这个功能并不复杂。

2 个赞

谢谢 Sam!

根据 Vision - OpenAI API

Vision 和 turbo 应该基本相同(但不确定,还没有经过彻底测试)。

1 个赞