DiscourseAI の感情分析と感情認識をセルフホスティングする

Falco · 2024 年 11 月 4 日午後 5:56

Discourse AI プラグインは、新しい投稿の感情・センチメント分類をリクエストする機能をサポートしており、このデータはデータベースに保存され、レポートや管理ダッシュボードで利用できます。

Discourse AI は、それぞれ固有のモデルを必要とする 2 種類の分類をサポートしています。

センチメント — 投稿をポジティブ、ネガティブ、またはニュートラルに分類します（cardiffnlp/twitter-roberta-base-sentiment-latest を使用）
感情 — 喜び、怒り、驚きなど、28 の感情ラベルにわたって投稿を分類します（SamLowe/roberta-base-go_emotions を使用）

ダッシュボードでセンチメントと感情の両方のデータを取得するには、両方のモデルを実行する必要があります。

HuggingFace TEI での実行

HuggingFace は、すぐに実行を開始できる素晴らしいコンテナイメージを提供しています。

センチメントモデル

mkdir -p /opt/tei-sentiment-cache
docker run --rm --gpus all --shm-size 1g -p 8081:80 \
  -v /opt/tei-sentiment-cache:/data \
  ghcr.io/huggingface/text-embeddings-inference:latest \
  --model-id cardiffnlp/twitter-roberta-base-sentiment-latest \
  --revision refs/pr/30

これにより、投稿をポジティブ/ネガティブ/ニュートラルに分類できるオープンモデルである cardiffnlp/twitter-roberta-base-sentiment-latest のローカルインスタンスが起動します。

動作確認は以下のコマンドで行えます。

curl http://localhost:8081/ \
    -X POST \
    -H 'Content-Type: application/json' \
    -d "{ \"inputs\": \"I am happy\" }"

正常に動作すれば、各ラベルに対する信頼度の配列が返されます。

感情モデル

感情分類も行うには、感情モデルを使用して 2 つ目のコンテナを実行します。

mkdir -p /opt/tei-emotion-cache
docker run --rm --gpus all --shm-size 1g -p 8082:80 \
  -v /opt/tei-emotion-cache:/data \
  ghcr.io/huggingface/text-embeddings-inference:latest \
  --model-id SamLowe/roberta-base-go_emotions

サポートされているモデル

cardiffnlp/twitter-roberta-base-sentiment-latest · Hugging Face — センチメント（ポジティブ/ネガティブ/ニュートラル）
SamLowe/roberta-base-go_emotions · Hugging Face — 感情（28 の感情ラベル）

Discourse インスタンスで利用可能にする

GPU による高速化のため、通常は専用サーバーで実行することになります。その場合、リバースプロキシを実行し、TLS 終端を行い、Discourse インスタンスからの接続のみを許可するようにエンドポイントを保護することを推奨します。

Discourse AI の設定

Discourse AI には、オープンソースモデル用の推論サーバーを設定するサイト設定が含まれています。ai_sentiment_model_configs 設定を使用して、サーバーを指し示すように設定してください。

この設定は、モデル設定の JSON 配列を受け取ります。各エントリには以下の情報が必要です。

フィールド	説明
`model_name`	HuggingFace のモデル ID（例：`cardiffnlp/twitter-roberta-base-sentiment-latest`）
`endpoint`	TEI インスタンスの URL（例：`https://your-server:8081`）
`api_key`	エンドポイントの API キー（不要な場合は空白のままにできます）

センチメントと感情の両方のダッシュボードを取得するには、実行している各モデルに対してエントリを追加します。例えば、両方のモデルをローカルで実行している場合：

エントリ 1: model_name cardiffnlp/twitter-roberta-base-sentiment-latest, endpoint https://your-server:8081
エントリ 2: model_name SamLowe/roberta-base-go_emotions, endpoint https://your-server:8082

その後、ai_sentiment_enabled を切り替えて分類機能を有効にします。

haozi · 2024 年 12 月 4 日午前 2:17

英語以外の言語の他のモデルをサポートする計画はありますか？

RBoy · 2025 年 3 月 26 日午前 1:45

@Falco、もしこれをDiscourseを実行しているのと同じサーバーで実行することにした場合（例えば、数千件の投稿がある非常に小規模なデプロイメントの場合）、以下の手順を更新していただけますでしょうか。

HuggingFace TEIコンテナイメージのローカルインスタンスとDiscourseを連携させる方法
上記を実行するために必要な追加のRAM/ディスク容量の提案（例えば、ベースのDiscourseが2GB RAMと20GBディスクで実行されている場合）

agent_kith · 2025 年 6 月 20 日午前 4:06

新しいセルフホストのDiscourseインスタンスを設定し、センチメントをセットアップしようとしています。これが私の ai_sentiment_model_configs です。

キー	値
model name	cardiffnlp/twitter-roberta-base-sentiment-latest
endpoint	https://my_own_instance
api_key	[blank]

そして、それはある程度機能し、センチメントの棒グラフが表示されます。

しかし、感情のテーブルが空です。このドキュメントは不完全か、私が理解するには言葉足らずのようです。

別のDockerコンテナを、異なるモデルID（roberta-base-go_emotions?）で実行する必要がありますか、それとも何か他のことですか？感情のテーブルを埋めるために何をする必要がありますか？

可能であれば、これらのサービスをセルフホストしたいです。誰かが私を正しい方向に向かわせてくれれば幸いです。

Falco · 2025 年 6 月 20 日午後 3:26

感情については、以下を実行する必要があります。

も。

agent_kith · 2025 年 6 月 21 日午前 12:34

ありがとうございます。それでは、次のようにいくつかの調整を加えて、2番目のDockerコンテナを実行します。

mkidr -p /opt/tei-cache2
docker run --detach --rm --gpus all --shm-size 1g -p 8082:80 \
  -v /opt/tei-cache2:/data \
  ghcr.io/huggingface/text-embeddings-inference:latest \
  --model-id SamLowe/roberta-base-go_emotions

そして、ai_sentiment_model_configsに新しいエントリを追加すると、すべて正常に動作するようになります。ありがとうございました。

Lee_Ars · 2025 年 8 月 17 日午後 6:39

GPUなしでこれをEC2インスタンスで動作させようとして、自分が何をやっているのか全く分からないというレンガの壁に顔面から突っ込んだ。少なくとも、私の非常に限られた能力と理解の範囲では、CPUのみのインスタンスでこれをやろうとすると、理解できないほど多くの設定作業が必要になる。ghcr.io/huggingface/text-embeddings-inference の cpu バージョンは、どちらのリスニングモデルもロードしようとしない。ClaudeとGPT5は両方とも、Pythonツール一式を使ってONNXモデルに変換する必要があると言っており、そこで私はギブアップした。

（私が単に愚かで、明白なステップを見逃している可能性も非常に高い！）

sam · 2025 年 8 月 17 日午後 11:17

私たちが計画していることの一つは、LLMをセンチメント分析として利用できるようにすることです。

そうすれば、Gemini Flash 2.5（あるいはNano）のような安価なモデルを接続して、センチメント分析に使用できます。

Neil_Evans2 · 2025 年 8 月 27 日午前 8:35

Azure AI Language（セルフホストのDiscourseインスタンスから）でこの機能を使用しようとしています。GPT-4.5をDiscourse（要約およびチャットボット機能用）に統合するためにAzureサブスクリプションをすでに利用しているためです。

しかし、センチメントダッシュボードにデータが表示されず、ログに次のエラーが表示されています。

Discourse AI: Errors during bulk classification: Failed to classify 208 posts (example ids: 2256, 909, 2270, 2260, 2797) : JSON::ParserError : An empty string is not a valid JSON string.

バックトレースによると、DiscourseはHuggingFaceを使用しようとしている可能性があります。現時点ではこれらのモデルのみがサポートされていますか？

ありがとうございます。

N

sam · 2025 年 8 月 27 日午後 11:47

はい、私たちは非常に特殊な実装をしており、それをより汎用的にする方法を考えています。

LLMにセンチメントの構造化された出力を返させることには非常に前向きです。なぜなら、それは多くの選択肢を開くからです。そして、トレンドとして「超特化型」APIは、LLMが提供する「超汎用型」APIに取って代わられつつあると感じています。

dylanb · 2025 年 8 月 28 日午前 1:03

自己ホスト型WordPressでセンチメント分類用のインスタンスをセットアップせずにこれを簡単に実行する方法はありますか？

Neil_Evans2 · 2025 年 8 月 28 日午後 4:10

サム、ありがとうございます。それは素晴らしいでしょう。それまでの間、Azure VMでサポートされているHuggingFaceモデルのいずれかを実行することを検討します…

NotAnonymous · 2026 年 5 月 12 日午後 8:49

セルフホストのセンチメント分析の設定を試みていますが、Docker イメージを実行するとエラーが発生します。

0: リクエストエラー: HTTP ステータス クライアント エラー (404 Not Found) for url (https://huggingface.co/cardiffnlp/twitter-roberta-base-sentiment-latest/resolve/main/tokenizer.json)
1: HTTP ステータス クライアント エラー (404 Not Found) for url (https://huggingface.co/cardiffnlp/twitter-roberta-base-sentiment-latest/resolve/main/tokenizer.json)

使用しているコマンドは以下の通りです：
docker run --rm --shm-size 1g -p 8083:80 -v /opt/tei-sentiment-cache:/data ghcr.io/huggingface/text-embeddings-inference:cpu-1.9 --model-id cardiffnlp/twitter-roberta-base-sentiment-latest

GPU サポートなしではサポートされていないのでしょうか、それともセットアップに変更があったのでしょうか？

Falco · 2026 年 5 月 12 日午後 9:16

ああ、どうやら私のモデルへのプルリクエストはまだマージされていないようです。そのため、直接私のブランチを指す必要があります。上記の感情分析モデル用の Docker コマンドを更新しましたので、ブランチを指すための追加行を含めてお試しください。

NotAnonymous · 2026 年 5 月 12 日午後 9:24

ありがとうございます、うまくいったようです！

トピック		返信	表示
Discourse AI - Sentiment Site Management ai , content , ai-sentiment , how-to	14	5643	2025 年 10 月 24 日
Discourse AI - Self-Hosted Guide Self-Hosting ai	61	13588	2025 年 4 月 30 日
AI - Sentiment Analysis supported languages Support ai , ai-sentiment	5	168	2024 年 10 月 23 日
Introducing Discourse AI Blog	26	3946	2023 年 5 月 4 日
關於Discourse AI Support ai	6	824	2024 年 10 月 1 日