AI助手在解释时经常出现幻想

我无法确定 AI 助手何时开始出现“幻觉”(即它不知道答案,开始变得……有创意),因为我过去三周一直有其他事情要做,但今天它的解释功能完全没用了。

我以前经常用它来向读者解释术语和表达方式,对我来说,这是 AI 助手能提供的最有价值的东西 [1]。当然,它确实有从帖子本身中寻找上下文的倾向,但这种程度的幻觉太离谱了。

这源于提示和/或模型。我是 OpenAI 的客户,我认为我不会想更换,因为那样我还需要编辑所有提示。自托管模型不是一个选项,我太穷了。

那么,我现在有哪些现实的选择?停止使用它?

编辑

我使用了 4.o-mini 并将其更改为 4.1-mini。我得到了更好的回复,但是……它的常识相当——“有上限”是正确的词吗?它应该使用谷歌或其他东西,但那样的话就应该有能力编辑提示,如果我之前的讨论关于提示的理解是正确的话,那将不是一个选项。那么,如果我继续使用 OpenAI,我唯一的选择是转向更昂贵的模型吗?


  1. 我也想为我的用户提供这个选项,但我知道这真的很难,因为它现在需要编辑已发布帖子的能力。如果它能在编辑器中运行,那将是一个真正的改变者 ↩︎

1 个赞

我们距离允许您将助手连接到专用模型仅几周之遥,届时您可以尝试提示工程,看看是否能让更便宜的模型按您想要的方式运行。

不过,我还是建议您尝试 gemini flash 2.5,它非常便宜(甚至有免费套餐),应该比 4.1 mini 表现更好。

1 个赞

昨天,两个摘要器都开始在我的论坛上只使用英语。但因为我可以编辑提示,所以对于单语论坛来说很容易修复。在这种情况下,提示本身看起来完全正确,而且我也会使用如此通用的措辞,但懒惰的 OpenAI 模型走了捷径 :man_shrugging:

This topic was automatically closed 30 days after the last reply. New replies are no longer allowed.