Discourse インスタンスで AI スパム検出器を設定しようとしていますが、いくつかの質問があります。
スパム検出器のペルソナのシステムプロンプトは編集できません。新しいペルソナを作成することはできますが、Discourse にそれがスパム検出器として使用されることを知らせるフィールドがありません。
このタスクに Qwen3 を LLM として使用したいと考えています。Qwen3 のプリセットがないため、カスタムのものをいくつか作成するつもりです。しかし、Qwen3Tokenizer もありません。トークナイザーはここで何をするのですか?QwenTokenizer は Qwen3 で機能しますか?
あるいは、Webhook のようなサービスを設定し、新しいトピックや投稿時に Discourse がそれを呼び出すという、より簡単なオプションはありますか?
「いいね!」 2
ありがとうございます、トークナイザーが何であるかは分かっています。私が知らないのは、Discourseがそれを何のために使用しているのか、そして間違ったトークナイザーを選択した場合に何が起こるかということです。LLMを呼び出すのにトークナイザーは必要ありません。
nat
(Natalie T)
4
この https://<your-site>/admin/plugins/discourse-ai/ai-spam にアクセスして、カスタム指示を挿入し、投稿に対してテストできるか試してみてください。
私の理解が正しければ、この指示はシステムプロンプトに連結され、それを置き換えるのではなく、プロンプトをさらに長くし、言語が混在させることになりますね…
しかし、テストに合格したからといって、問題がないという意味ではありません。(ご参考までに、私はまだLLMを完全にセットアップしていません。無料のGeminiサービスを試しましたが429エラーが出たので、現在llama.cppをDiscourseに統合する方法を調べているところです。)
nat
(Natalie T)
6
クイックセットアップを行ったところ、スパムのカスタムペルソナを選択するのがうまく機能しました。


/discourse-ai/ai-spam からそれができない場合は、再度お知らせください。
「いいね!」 4
その「スパム検出器」ラベルは、ペルソナのリストフィルタリングにのみ影響するということですか?
テスト環境をセットアップして試してみます。
「いいね!」 1
ソースコードを確認しました。もし私が間違っていなければ、トークナイザーは統計情報のためのトークンカウントと料金見積もり、そして投稿を指定された制限内に切り詰めるという2つの目的で使用されています。したがって、間違ったものが使用されても、私に大きな影響はないはずです。
「いいね!」 1