Don
2024 年12 月 18 日 07:21
1
您好
我创建这个话题是为了分享使用 Discourse 上的新 AI 模型时的经验。
几天前,我设置了 grok-2-1212 来生成话题摘要。它的效果非常好。语言检测和质量都足够好。我也尝试用它来驱动 AI 机器人,但大多数时候都失败了,我猜它目前还不能很好地处理工具。
我也尝试了 Gemini Flash 2 来驱动 AI 机器人。它的运行速度很快,并且能给出很好的答案,但有时它似乎无法很好地处理工具,导致答案出错。有时只是简单的标记语言格式问题,有时它无法进行搜索。在我的论坛上,它大多数时候都说在论坛上找不到任何东西,但我知道有更多关于该主题的话题……
4 个赞
MihirR
(Mihir)
2024 年12 月 18 日 07:48
2
关于搜索问题,您认为这可能与人工智能未能完全索引论坛内容有关,还是查询理解存在不匹配?
2 个赞
Don
2024 年12 月 18 日 08:00
3
我没什么头绪。大多数时候它搜索不到任何东西“”或者因超时而失败……但有时它能正确搜索并链接到正确的主题。我认为这会很好,但它仍然是高度实验性的。
1 个赞
sam
(Sam Saffron)
2024 年12 月 18 日 08:15
4
您试过 xml 工具了吗?我发现在 grok 上它们效果相当不错。
3 个赞
Don
2024 年12 月 18 日 08:28
5
谢谢,我现在试过了。是的,看起来好多了,现在主要是在我创建新对话时出现问题。它会以英语开始,类似:“I am searching for…in sitename… ”然后停止回复。有时它会在英语的“I am searching… ”句子之后继续用正确的匈牙利语回答并给出很好的答案。但是,如果我在对话中回复 grok 的响应,它就能很好地工作。
2 个赞
sam
(Sam Saffron)
2024 年12 月 18 日 08:32
6
这真的很有趣,我想允许将“接地”示例作为个性化的选项,这完全可以解决这个问题。
2 个赞
MihirR
(Mihir)
2024 年12 月 18 日 08:36
7
太棒了!但你认为这会减慢速度吗,尤其是在处理大量数据时?这会影响 AI 查询或搜索结果的响应时间,还是都没问题?
1 个赞
sam
(Sam Saffron)
2024 年12 月 18 日 08:42
8
大问题示例是“污染”
模型学习形状,但有时也会错误地认为用户说了他们没说过的话。
理想情况下,精心设计系统消息可以解决问题,这是我的首选。
系统消息中的示例可以减少泄露,因为它能更清楚地表明模型只是在看示例。
我建议唐做的最基本的事情是,用匈牙利语写你的系统消息,这可能会有帮助。
也许甚至可以尝试在系统消息中提供一两个 XML 工具示例?
4 个赞
Don
2024 年12 月 18 日 09:08
10
我试过了,但使用 grok-2-1212 的结果相同,然后我将其切换到 grok-beta,它运行完美,但它也适用于英文系统消息……
4 个赞