Configurar cuotas de uso de LLM en Discourse AI

:bookmark: Esta guía explica cómo configurar y administrar las cuotas de uso para Modelos de Lenguaje Grandes (LLM) en Discourse AI.

:person_raising_hand: Nivel de usuario requerido: Administrador

Resumen

Las cuotas de uso de LLM permiten a los administradores controlar y monitorear el consumo de recursos de IA estableciendo límites en el uso de tokens e interacciones para diferentes grupos de usuarios. Esto ayuda a mantener la eficiencia de costos y, al mismo tiempo, garantiza un acceso justo a las funciones de IA en toda su comunidad.

Configuración

Acceso a la configuración de cuotas

  1. Navegue al panel de administración de su sitio
  2. Vaya a Admin > Plugins > Discourse AI > LLM Models
  3. Seleccione el modelo LLM que desea configurar

Configuración de cuotas

Para cada grupo de usuarios, puede configurar:

  • Uso máximo de tokens
  • Y/O número máximo de interacciones de IA
  • Duración del período de reinicio

Opciones de duración

Elija entre períodos de reinicio preestablecidos:

  • 1 hora
  • 6 horas
  • 24 horas
  • 7 días
  • Duración personalizada (especificada en horas)

Monitoreo de uso

Visualización de estadísticas

Los administradores pueden monitorear el consumo de tokens y el consumo de uso en: https://SITENAME/admin/plugins/discourse-ai/ai-usage

  1. Navegue a Admin > Plugins > Discourse AI
  2. Seleccione la pestaña "Uso"
  3. Filtre por rango de fechas, grupo de usuarios o métricas específicas

Experiencia del usuario

Notificaciones de cuota

Los usuarios reciben comentarios claros cuando se acercan o alcanzan los límites de cuota:

  • Estado de uso actual
  • Tiempo hasta el próximo reinicio de cuota

Mensajes de error

Cuando se excede una cuota, los usuarios ven:

  • Una notificación clara de que se ha alcanzado el límite de cuota
  • El tiempo restante hasta su próximo reinicio de cuota

Mejores prácticas

  1. Comience de forma conservadora: comience con cuotas más bajas y ajústelas según los patrones de uso reales
  2. Asignación basada en grupos: asigne diferentes cuotas según las necesidades y roles de los grupos de usuarios
  3. Monitoreo regular: revise los patrones de uso para optimizar la configuración de cuotas
  4. Comunicación clara: informe a los usuarios sobre los límites de cuota y los períodos de reinicio

Problemas y soluciones comunes

Problema: Los usuarios alcanzan frecuentemente los límites

Solución: Considere:

  • Aumentar los límites de cuota para grupos específicos
  • Reducir el período de reinicio
  • Crear grupos especializados para usuarios de alto uso

Problema: Cuotas no utilizadas

Solución:

  • Ajuste los límites a la baja para optimizar la asignación de recursos
  • Revise las asignaciones de grupos para garantizar que las cuotas coincidan con las necesidades de los usuarios

Preguntas frecuentes

P: ¿Se pueden suspender temporalmente las cuotas?
R: Sí, los administradores pueden deshabilitar temporalmente la aplicación de cuotas para grupos específicos o para todo el sitio.

P: ¿Las cuotas no utilizadas se acumulan?
R: No, las cuotas se reinician por completo al final de cada período.

P: ¿Pueden diferentes modelos LLM tener diferentes cuotas?
R: Sí, las cuotas se pueden configurar de forma independiente para cada LLM.

P: ¿Qué sucede si se establecen varias cuotas para un solo LLM?
R: Las cuotas se basan en el grupo y se aplican por usuario. Para que un usuario exceda la cuota, debe exceder la cuota en todos los grupos. Esto significa que si usted otorga a los administradores una cuota muy flexible y al nivel de confianza 1 una más restrictiva, se aplicará la cuota de administrador a los administradores.

P: ¿Qué sucede si no se aplica ninguna cuota a un LLM?
R: No sucederá nada especial, todo el uso de LLM no se medirá.

P: ¿Qué pasa si quiero diferentes cuotas para diferentes funciones?
R: Discourse AI le permite definir múltiples LLMs que se conectan al mismo endpoint e incluso pueden reutilizar claves. Si desea dar una cuota al asistente de IA y otra al bot de IA, defina 2 LLMs.

Recursos adicionales

10 Me gusta

Parece que no podemos prohibir completamente que un grupo use un modelo específico estableciendo la cuota en 0.

¿Podrías añadir soporte para esta configuración?

Lo siento, ¿puedes ampliar aquí? Cada función también está restringida por grupo, por lo que de todos modos solo puedes habilitar el asistente para un subconjunto de usuarios.

Quiero que algunos modelos premium estén restringidos solo a grupos específicos. Sería genial si pudiéramos establecer la cuota de un modelo en 0 para deshabilitar el acceso a ciertos grupos.

2 Me gusta

Sí, es un problema interesante. Lo pensaré.

Es posible que desees que el asistente use GPT4o para el “grupo especial 1” y GPT4o mini para el resto de las personas.

En este momento, solo te permitimos seleccionar un modelo para el asistente de IA, por lo que necesitaríamos un cambio bastante grande para admitir esto.

@Falco / @Saif / @awesomerobot, algo en lo que pensar.

5 Me gusta