このガイドでは、Discourse AI における大規模言語モデル (LLM) の使用クォータの設定と管理方法について説明します。
必要なユーザーレベル: 管理者
概要
LLM 使用クォータにより、管理者はトークン使用量とインタラクションに制限を設定することで、さまざまなユーザーグループの AI リソース消費を制御および監視できます。これにより、コミュニティ全体で AI 機能への公平なアクセスを確保しながら、コスト効率を維持できます。
設定
クォータ設定へのアクセス
- サイトの管理パネルに移動します
管理 > プラグイン > Discourse AI > LLMに移動します- 設定したい LLM モデルを選択します
クォータの設定
ユーザーグループごとに、以下を設定できます。
- 最大トークン使用量
- および/または AI インタラクションの最大回数
- リセット期間の長さ
各クォータに対して、最大トークンまたは最大使用量のいずれか一方が設定されている必要があります。
注: 「everyone」グループにはクォータを割り当てることができません。特定のグループ(例: 信頼レベルグループやカスタムグループ)を使用する必要があります。
期間のオプション
プリセットされたリセット期間から選択します。
- 1 時間
- 6 時間
- 24 時間
- 7 日
- カスタム期間(時間単位で指定)
使用状況の監視
統計の表示
管理者は、トークン消費量と使用量消費量を次の場所で監視できます: https://SITENAME/admin/plugins/discourse-ai/ai-usage
管理 > プラグイン > Discourse AIに移動します- 「Usage (使用状況)」タブを選択します
- 日付範囲、ユーザーグループ、または特定のメトリクスでフィルタリングします
ユーザーエクスペリエンス
クォータ通知
ユーザーは、クォータ制限に近づいたとき、または達したときに明確なフィードバックを受け取ります。
- 現在の使用状況
- 次のクォータリセットまでの時間
エラーメッセージ
クォータを超過した場合、ユーザーには以下が表示されます。
- クォータ制限に達したことを示す明確な通知
- 次のクォータリセットまでの残り時間
ベストプラクティス
- 控えめに開始: 低いクォータから開始し、実際の使用パターに基づいて調整します
- グループベースの割り当て: ユーザーグループのニーズと役割に基づいて異なるクォータを割り当てます
- 定期的な監視: クォータ設定を最適化するために使用パターンを確認します
- 明確なコミュニケーション: ユーザーにクォータ制限とリセット期間について通知します
一般的な問題と解決策
問題: ユーザーが頻繁に制限に達する
解決策: 次のことを検討してください。
- 特定のグループのクォータ制限を引き上げる
- リセット期間を短縮する
- 高頻度で利用するユーザーのために特別なグループを作成する
問題: 未使用のクォータ
解決策:
- 割り当てを最適化するために制限を引き下げる
- クォータがユーザーのニーズに合っていることを確認するためにグループの割り当てを見直す
FAQ
Q: 未使用のクォータは繰り越されますか?
A: いいえ、クォータは各期間の終わりに完全にリセットされます。
Q: 異なる LLM モデルで異なるクォータを設定できますか?
A: はい、クォータは LLM ごとに個別に設定できます。
Q: 単一の LLM に対して複数のクォータが設定されている場合はどうなりますか?
A: クォータは グループ ベースであり、ユーザーごとに適用されます。ユーザーがクォータを超えるには、すべてのグループのクォータを超える必要があります。これは、管理者に非常に緩いクォータを与え、信頼レベル 1 により制限的なクォータを与えた場合、管理者クォータが管理者に適用されることを意味します。
Q: LLM にクォータが適用されていない場合はどうなりますか?
A: 特に何も起こりません。すべての LLM 使用は無制限になります。
Q: 機能ごとに異なるクォータを設定したい場合はどうすればよいですか?
A: Discourse AI では、同じエンドポイントに接続する複数の LLM を定義でき、必要に応じてキーを再利用することもできます。AI ヘルパーに 1 つのクォータを、AI エージェントに別のクォータを与えたい場合は、2 つの LLM を定義します。
Q: クォータを削除するにはどうすればよいですか?
A: LLM モデルの設定ページからクォータを削除します。クォータを一時的に「一時停止」または無効にする方法はありません。削除して再作成する必要があります。


