公式の Discourse AI プラグインと Discourse Chatbot 🤖 プラグインでは、AI ボットとその機能に関してどのような違いがありますか?
@merefield プラグインはより古くからあり、設定するためのノブもはるかに多く備えています。AI ボットは、特に GPT 4 へのアクセスがあるため、より野心的でもあります。たとえば、トピックを検索して要約する方法を知っているなど、Discourse 体験に統合しようと試みています。
現時点での注目すべき違いはおそらく次のとおりです。
- 返信をストリーミングし、停止ボタンを提供します。
- @merefield は、さまざまな設定を調整するためのより多くの設定を提供します。
- ボットに代わって行動させるための「コマンド」フレームワークを提供しますが、GPT 3.5 では経験がかなり不安定です。
- @merefield は現在 Discourse チャット統合を提供していますが、私たちはまだ提供していません。
- Anthropic 統合も提供しています。
追記:私のテストから、AIボットはプライベートメッセージでのみ機能し、チャットボットはどこでも機能するようです。AIボットで何か間違っている場合を除いて。
画像生成とストリーミングはうまくできており、検索APIも同様ですが、時々「ウェブを検索できません、または画像を生成できません」というフォールバックが発生します。どのような手順を踏むかを決定するLangChainエージェントのようなものを使用していますか?
CXを作成する際に、完全なウェブのスコープを作成するべきでしょうか、それともインスタンスURLのみでしょうか?
その通りです。おそらく広範な統合に取り組むことになるでしょうが、ここでは時間をかけて、既存のものをまず磨き上げていくつもりです。
はい、これはGPT 3.5と4の非常にイライラする点です。3.5のモデルをグラウンディングするのは非常に困難です。
返信する前に、まずトリアージを行う中間ステップを挟むことを検討しています(例:このインタラクションは!コマンドの結果として処理されるべきか、もしそうならどれか?)。残念ながら、コストと遅延が増加するため、これは最後の手段です。
「 langchain」のようなものを、5ステップに制限して使用していますが、トークンを非常に節約するように努めているため、バランスを取るのは難しいです。
それはあなた次第です…Google全体にアクセスできるのは非常に便利だと思います。
3.5をグラウンディングするために私がやっているのは、最終的なプロンプトの後半に、メインのシステムプロンプトのルールを「思い出させる」ために、2番目の短いシステムプロンプトを追加することです。
そのため、次のような形になります(携帯から入力しているので、試行錯誤中です…)
システムロール
ユーザー
アシスタント
…
…
システムロール「リマインダー」
新しいユーザープロンプト
最も重要なシステムロールの内容を繰り返すだけで、モデルはその内容により多くの重みを与えます。私はこの回避策を数ヶ月間使用しており、あまり奇妙な応答はありませんでした。
特にプロンプトが長くなると、モデルは最終的なプロンプトの上の方にあるものを「忘れて」しまう傾向があります。AIの世界は非常にハッキーで、GPTモデルやlangchainでも経験しています。今日、langchainで非常に強い個性が出てしまい、ランダムな都市の時間を尋ねたときの行動が、「時計を確認する」、「時計のタイムゾーンを変更する」、「見知らぬ人に尋ねる」といったものでした。