AIアシスタントの説明中にハルシネーションが多発

AIヘルパーが幻覚(つまり、知らないことを創造的に説明し始めること)を起こし始めたのがいつなのか特定できません。というのも、ここ3週間ほど別の用事があったからです。しかし、今日の「説明機能」は全く役に立ちませんでした。

以前は、読者に用語や表現を説明するためにこの機能([1])をよく使っていました。私にとって、AIヘルパーが提供できる最も価値のあるものでした。確かに、投稿自体から文脈を見つける傾向はありましたが、このレベルの幻覚は多すぎます。

これはプロンプトやモデルに起因します。私はOpenAIの顧客であり、プロンプトもすべて編集する必要があるため、変更するつもりはありません。自己ホスト型モデルは、私には貧乏すぎるので選択肢になりません。

では、現実的な選択肢は何でしょうか?使用をやめることでしょうか?

編集

4.o-miniを使用し、4.1-miniに変更しました。より良い返信が得られましたが…一般的な知識はかなり—「上限がある」という言葉が適切でしょうか?Googleなどを使用すべきですが、そうするとプロンプトを編集する機能が必要になります。以前のプロンプトに関する議論を正しく理解していれば、それは選択肢にはなりません。したがって、OpenAIを使い続ける場合、より高価なモデルに移行するのが唯一の選択肢なのでしょうか?


  1. ユーザーにもこのオプションを提供したいのですが、公開済みの投稿を編集する機能が必要なので、本当に難しいとわかっています。もしコンポーザーで動作できれば、本当にゲームチェンジャーになるでしょう ↩︎

「いいね!」 1

数週間後には、ヘルパーを専用ペルソナに接続できるようになります。その時点で、プロンプトエンジニアリングを試して、安価なモデルを希望どおりに動作させることができるかどうかを確認できます。

ただし、gemini flash 2.5を試すことをお勧めします。非常に安価(無料枠もあります)で、4.1 miniよりも優れたパフォーマンスを発揮するはずです。

「いいね!」 1

昨日、両方の要約ツールが私のフォーラムで英語のみを使用し始めました。しかし、私がプロンプトを編集できたため、シングルランゲージのフォーラムには簡単な修正が可能でした。その場合、プロンプト自体は完全に正しく見え、私もそのような一般的な表現を使いたいと思いましたが、怠惰なOpenAIのモデルは簡単な道を選びました🤷‍♂️

This topic was automatically closed 30 days after the last reply. New replies are no longer allowed.