| 概要 | Discourse Moderation API Plugin は、自動モデレーション機能でDiscourseフォーラムを強化します。Moderation APIの実績ある検出エンジンを活用し、改良されたモデレーションダッシュボードによりモデレーターの効率を10倍にします。 | |
| リポジトリリンク | https://github.com/moderation-api/discourse-moderation-api | |
| インストールガイド | Discourseにプラグインをインストールする方法 |
主な機能
Moderation APIは、フルスタックのモデレーションソリューションです。
自動モデレーションアクション
- コメントやトピックを自動的にフラグ付けします。
- 一般的なユースケースに対応する20以上の組み込み済みモデルから選択するか、独自のモデルを構築します。
- 有害性、NSFWコンテンツ、個人情報(PII)、スパム、自己宣伝、違法行為などを検出します。
- 自動フラグ付けのカスタムしきい値を設定します。
LLM搭載検出
- コミュニティガイドラインをAIエージェントに統合します。
- AIを第一線での防御策として、またはコメントをフラグ付けする信頼できるモデレーターとして活用します。
カスタムモデルトレーニング
- 最も高いモデレーション精度を実現するために、独自のAIモデルを開発します。
- モデレーターのアクションをフィードバックとして使用し、モデルをトレーニングおよび改良します。
- 機械学習を通じて、自動フラグ付けを継続的に強化します。
強化されたレビューキュー
- 合理化されモダンなモデレーション体験のために、オプションでModeration APIのレビューキューを使用します。
- 言語、カテゴリ、または特定の目的に合わせて調整された複数のレビューキューを作成します。
- コンテンツのエスカレーションのためのモデレーションワークフローを開発します。
- 効率的な管理のために、特定のレビューキューにモデレーターを割り当てます。
ダッシュボード分析
- Moderation APIダッシュボードを通じてAIのアクティビティと結果を監視します。
- 一般的な問題に関する洞察を得て、改善が必要な領域を特定します。
シームレスな統合
- 既存のDiscourseワークフローとユーザーロールに簡単に統合できます。
- DiscourseのレビューキューまたはModeration APIのレビューキューを選択できます。
- Discourseの組み込みモデレーションアクションを利用します。
設定
Moderation API Pluginを設定するには、以下の手順に従ってください。
Moderation APIでプロジェクトを作成する
- Moderation APIダッシュボードに移動します。
- 新しいプロジェクトを作成し、検出したいラベルを選択します。
(オプション) しきい値をテストおよび調整する
- しきい値スライダーを使用して、モデレーションの厳格さを決定します。
- プレイグラウンドでAPIレスポンスをテストします。
APIキーを設定する
- プロジェクトダッシュボードの「統合」の下にあるAPIキーを見つけます。
- Discourseの管理パネルで、「設定」>「Moderation API」に移動します。
- Moderation API KeyフィールドにAPIキーを貼り付けます。
- 変更を保存します。
プラグインを有効にする
- フラグ付けの動作を選択します(以下のオプションを参照)。アクションを実行せずにプラグインをテストするために、「なし」から始めることができます。
- プラグインを有効にして、新しい投稿の分析を開始します。プラグインは既存のコンテンツを分析しません。
(オプション) コミュニティガイドラインを追加する
- Moderation APIの「モデルスタジオ」に移動します。
- 新しいAIエージェントを作成します。
- ガイドラインをエージェントのルールとして組み込みます。広範なガイドラインがある場合は、複数のエージェントの作成を検討してください。
- エージェントをプロジェクトに追加します。
フラグ付けの動作
プラグインには4つの異なるフラグ付け動作があり、Moderation APIがコメントをフラグ付けしたときに実行されるアクションを決定します。
1. フラグ付け(デフォルトの動作)
プラグインボットは、Discourseの設定に従って、コメントに「不適切」フラグを追加します。通常、これはコメントがレビューキューに表示されることを意味しますが、モデレーターが承認するか、追加のユーザーがコメントにフラグを立てるまで、すぐに非表示にならない場合があります。カスタマイズについては、Discourseのフラグ関連設定を確認してください。
2. レビューのためにキューに入れる
コメントは即座に非表示になり、モデレーターが承認または却下するためにレビューキューに追加されます。
3. 投稿をブロックする
コメントは投稿されません。投稿者は、コメントが自動モデレーションシステムによってブロックされたことを示すエラーメッセージを受け取ります。(エラーメッセージはカスタマイズできます。)
4. なし
即座のアクションは実行されません。コメントは分析され、フラグが付けられた場合はModeration APIダッシュボードに表示されます。このオプションは、プラグインを完全に有効にする前にModeration APIをテストする場合に便利です。
TODO
- Moderation APIのレビューキューからDiscourseのコンテンツを削除するアクションを有効にする。
- DiscourseのレビューキューからModeration APIのレビューキューへのアクションを同期する。
- カテゴリごとに個別のモデレーションプロジェクトを許可する。
- 選択したDiscourseフラグ付けカテゴリを使用してコンテンツにフラグを立てる(現在は「不適切」を使用)。
設定
以下は、Moderation API Pluginで利用可能な設定とその説明の表です。
| 設定 | 説明 |
|---|---|
| Moderation APIを有効にする | プラグインがアクティブかどうかを制御します。 デフォルト: 無効 |
| フラグ付けの動作 | コンテンツがフラグ付けされたときに実行されるアクション: • レビューのためにキューに入れる • 投稿にフラグを立てる • 投稿をブロックする • なし デフォルト: 投稿にフラグを立てる |
| ブロックメッセージ | 投稿がブロックされたときにユーザーに表示されるメッセージ。 デフォルト: 「お客様の投稿は当社のモデレーションシステムによってブロックされました。」 |
| 投稿キューでの通知 | 投稿がレビューのためにキューに入れられたときに通知を送信します。 デフォルト: 有効 |
| プライベートメッセージを確認する | モデレーションをプライベートメッセージに適用します。 デフォルト: 無効 |
| スキップグループ | モデレーションチェックをバイパスするユーザーグループ。 デフォルト: なし |
| スキップカテゴリ | モデレーションチェックをバイパスするフォーラムカテゴリ。 デフォルト: なし |
| APIキー | Moderation API認証キー。 デフォルト: なし |
サブスクリプション
プラグインをすぐにインストールして、無料ティアまたは30日間のトライアルをご利用いただけます。より高度な機能と高い使用制限については、サブスクリプションオプションをご覧ください。
ドキュメント
サポート
- サポートを受ける: support@moderationapi.com
- 機能リクエスト: 機能リクエスト
- 問題の報告: こちらから報告
免責事項: Discourse Moderation API Pluginはモデレーション機能を大幅に強化しますが、自動モデレーションの影響をレビューして理解することが不可欠です。モデレーションプロセスにおけるAIの使用に関して、常にコミュニティに透明性を確保してください。
プライバシーに関する注意: このプラグインは、モデレーションルールを施行するためにユーザー生成コンテンツを処理します。プライバシーポリシーを遵守し、データ処理慣行についてユーザーに通知してください。


