Bathinda
(Bathinda Helper)
1
为了在我们的“D”网站上生成人工智能图像字幕,我们可以使用 OpenAI 的付费计划(您甚至需要在您的账户中预先充值才能开始),或者免费的开源 Llava 人工智能 API。
但是,为了获得有关如何生成 Llava API 密钥的指导,我已经在谷歌上搜索了 3 个小时,但即使观看了许多视频,我也未能朝着正确的方向找到任何线索。
Llava 界面/网站似乎没有直接生成所需 API 密钥的选项:
我认为,如果有一个“小链接”能将好奇的用户引向正确的方向,那对用户来说将是非常宝贵的。类似于这样:
或者更好的是,像这样:
Bathinda
(Bathinda Helper)
3
谢谢。
但我发现这可能只帮我前进了一步。因为对于 Google Gemini,一旦我在 D-Site 设置中填入了密钥,所有依赖 Gemini 的功能都开始完美运行。
但即使在 D-Site 设置中填入了您指导我填写的 Hugging Face API 密钥后,图像字幕功能仍显示“错误 500”(如果我选择“Open-Ai Gpt4-Vision Preview”作为图像字幕模型,则相同的图像字幕功能可以正常工作)。
而且,由于 Llava 似乎有所不同,因为 D-Site 设置中有许多名为 Hugging Face 或 Llava 的空白字段(为什么他们在同一个地方使用 Llava,而在另一个地方使用 Hugging Face 也会增加混淆),我确信这些字段不会是多余的。
所以,您能否为我指出一些互联网资源,这些资源可以帮助我获取 D-Site 设置中所有这些空白字段的值,或者帮助我正确实现它。
Falco
(Falco)
5
目前,对于 LLaVa,我们仅支持通过 ghcr.io/xfalcox/llava:latest 容器镜像进行自托管。
如果您确实拥有至少具有 24GB VRAM 的 GPU 服务器,则可以自托管,否则我建议您继续使用 GPT-4V。
2 个赞
system
(system)
关闭
6
This topic was automatically closed 30 days after the last reply. New replies are no longer allowed.