本指南说明了如何启用和配置由人工智能驱动的图像字幕功能,它是 Discourse AI 插件的 Helper 功能的一部分。
所需用户级别:管理员
图像字幕功能允许用户利用人工智能为任何上传的图像添加字幕,提供详细的描述。用户可以通过点击作曲器中图像上显示的 Caption with AI (使用 AI 字幕) 按钮手动触发字幕生成。
功能特性
- 作曲器中图像上的手动
Caption with AI按钮 - 可编辑的字幕,带有“ (Captioned by AI)” (由 AI 字幕) 署名
启用图像字幕
先决条件
您必须至少从一个提供商配置一个由视觉驱动的大型语言模型 (LLM)。
要开始使用,您可以 Discourse AI - Large Language Model (LLM) settings page 配置它们。
- OpenAI
- Anthropic
- Azure OpenAI
- 具有 Anthropic 访问权限的 AWS Bedrock
- 带有 Llama2 类似模型的 HuggingFace Endpoints
- 自托管开源 LLM
- Google Gemini
- Cohere
配置
- 转到 管理 → 插件 (Admin → Plugins)
- 搜索
discourse-ai并确保其已启用 - 确保通过勾选
ai helper enabled(AI 助手已启用) 来启用 Helper 功能 - 在
ai helper enabled features(AI 助手已启用功能) 中,确保添加了image_caption— 请注意,它默认不包含在内 - 在
ai helper image caption agent(AI 助手图像字幕代理) 中选择代理 - 确保所需的用户组 包含在
composer ai helper allowed groups(作曲器 AI 助手允许的用户组) 中,以便他们可以使用字幕按钮
技术常见问题解答
为什么字幕描述与图像不符?
- 这取决于由视觉驱动的 LLM 和图像本身。更强大的 LLM 可能能够更好地描述图像,但这取决于模型。图像保真度和图像主题也是考虑字幕输出的重要因素。

