Configuración de cuotas de uso de LLM en Discourse AI

:bookmark: Esta guía explica cómo configurar y gestionar las cuotas de uso para los Modelos de Lenguaje Grandes (LLMs) en Discourse AI.

:person_raising_hand: Nivel de usuario requerido: Administrador

Resumen

Las Cuotas de Uso de LLM permiten a los administradores controlar y supervisar el consumo de recursos de IA estableciendo límites en el uso de tokens e interacciones para diferentes grupos de usuarios. Esto ayuda a mantener la eficiencia de costos mientras se garantiza un acceso justo a las funciones de IA en toda su comunidad.

Configuración

Acceso a la configuración de cuotas

  1. Navegue al panel de administración de su sitio
  2. Vaya a Administración > Plugins > Discourse AI > LLMs
  3. Seleccione el modelo de LLM que desea configurar

Configuración de cuotas

Para cada grupo de usuarios, puede configurar:

  • Uso máximo de tokens
  • Y/O Número máximo de interacciones de IA
  • Duración del período de reinicio

Se debe establecer como mínimo el número máximo de tokens o el número máximo de usos para cada cuota.

:notepad_spiral: Nota: El grupo “everyone” (todos) no puede tener asignada una cuota. Debe usar grupos específicos (por ejemplo, grupos de nivel de confianza o grupos personalizados).

Opciones de duración

Elija entre períodos de reinicio preestablecidos:

  • 1 hora
  • 6 horas
  • 24 horas
  • 7 días
  • Duración personalizada (especificada en horas)

Supervisión del uso

Visualización de estadísticas

Los administradores pueden supervisar el consumo de tokens y el consumo de uso en: https://SITENAME/admin/plugins/discourse-ai/ai-usage

  1. Navegue a Administración > Plugins > Discourse AI
  2. Seleccione la pestaña “Usage” (Uso)
  3. Filtre por rango de fechas, grupo de usuarios o métricas específicas

Experiencia del usuario

Notificaciones de cuota

Los usuarios reciben comentarios claros al acercarse o alcanzar los límites de cuota:

  • Estado del uso actual
  • Tiempo hasta el próximo reinicio de la cuota

Mensajes de error

Cuando se excede una cuota, los usuarios ven:

  • Una notificación clara de que se ha alcanzado el límite de la cuota
  • El tiempo restante hasta su próximo reinicio de cuota

Mejores prácticas

  1. Comience conservadoramente: Comience con cuotas más bajas y ajústelas según los patrones de uso reales
  2. Asignación basada en grupos: Asigne cuotas diferentes según las necesidades y funciones de los grupos de usuarios
  3. Supervisión regular: Revise los patrones de uso para optimizar la configuración de las cuotas
  4. Comunicación clara: Informe a los usuarios sobre los límites de las cuotas y los períodos de reinicio

Problemas comunes y soluciones

Problema: Los usuarios alcanzan los límites con frecuencia

Solución: Considere:

  • Aumentar los límites de cuota para grupos específicos
  • Reducir el período de reinicio
  • Crear grupos especializados para usuarios de alto uso

Problema: Cuotas no utilizadas

Solución:

  • Ajuste los límites a la baja para optimizar la asignación de recursos
  • Revise las asignaciones de grupo para asegurarse de que las cuotas coincidan con las necesidades del usuario

Preguntas frecuentes

P: ¿Las cuotas no utilizadas se acumulan?
R: No, las cuotas se restablecen completamente al final de cada período.

P: ¿Pueden los diferentes modelos de LLM tener diferentes cuotas?
R: Sí, las cuotas se pueden configurar de forma independiente para cada LLM.

P: ¿Qué sucede si se configuran varias cuotas para un solo LLM?
R: Las cuotas se basan en el grupo y se aplican por usuario. Para que un usuario exceda la cuota, debe exceder la cuota en todos los grupos. Esto significa que si otorga a los administradores una cuota muy relajada y al nivel de confianza 1 una más restrictiva, la cuota de administrador se aplicará a los administradores.

P: ¿Qué sucede si no se aplica ninguna cuota a un LLM?
R: No sucederá nada especial, todo el uso de LLM no tendrá medidor.

P: ¿Qué pasa si quiero cuotas diferentes para diferentes funciones?
R: Discourse AI le permite definir múltiples LLMs que se comunican con el mismo endpoint e incluso pueden reutilizar claves. Si desea dar una cuota al asistente de IA y otra al agente de IA, defina 2 LLMs.

P: ¿Cómo elimino una cuota?
R: Elimine la cuota desde la página de configuración del modelo LLM. No hay forma de “pausar” o deshabilitar temporalmente una cuota; debe eliminarse y recrearse.

Recursos adicionales

11 Me gusta

Parece que no podemos prohibir completamente que un grupo use un modelo específico estableciendo la cuota en 0.

¿Podrías añadir soporte para esta configuración?

Lo siento, ¿puedes ampliar aquí? Cada función también está restringida por grupo, por lo que de todos modos solo puedes habilitar el asistente para un subconjunto de usuarios.

Quiero que algunos modelos premium estén restringidos solo a grupos específicos. Sería genial si pudiéramos establecer la cuota de un modelo en 0 para deshabilitar el acceso a ciertos grupos.

2 Me gusta

Sí, es un problema interesante. Lo pensaré.

Es posible que desees que el asistente use GPT4o para el “grupo especial 1” y GPT4o mini para el resto de las personas.

En este momento, solo te permitimos seleccionar un modelo para el asistente de IA, por lo que necesitaríamos un cambio bastante grande para admitir esto.

@Falco / @Saif / @awesomerobot, algo en lo que pensar.

5 Me gusta