Esta guía explica cómo configurar y gestionar las cuotas de uso para los Modelos de Lenguaje Grandes (LLMs) en Discourse AI.
Nivel de usuario requerido: Administrador
Resumen
Las Cuotas de Uso de LLM permiten a los administradores controlar y supervisar el consumo de recursos de IA estableciendo límites en el uso de tokens e interacciones para diferentes grupos de usuarios. Esto ayuda a mantener la eficiencia de costos mientras se garantiza un acceso justo a las funciones de IA en toda su comunidad.
Configuración
Acceso a la configuración de cuotas
- Navegue al panel de administración de su sitio
- Vaya a
Administración > Plugins > Discourse AI > LLMs - Seleccione el modelo de LLM que desea configurar
Configuración de cuotas
Para cada grupo de usuarios, puede configurar:
- Uso máximo de tokens
- Y/O Número máximo de interacciones de IA
- Duración del período de reinicio
Se debe establecer como mínimo el número máximo de tokens o el número máximo de usos para cada cuota.
Nota: El grupo “everyone” (todos) no puede tener asignada una cuota. Debe usar grupos específicos (por ejemplo, grupos de nivel de confianza o grupos personalizados).
Opciones de duración
Elija entre períodos de reinicio preestablecidos:
- 1 hora
- 6 horas
- 24 horas
- 7 días
- Duración personalizada (especificada en horas)
Supervisión del uso
Visualización de estadísticas
Los administradores pueden supervisar el consumo de tokens y el consumo de uso en: https://SITENAME/admin/plugins/discourse-ai/ai-usage
- Navegue a
Administración > Plugins > Discourse AI - Seleccione la pestaña “Usage” (Uso)
- Filtre por rango de fechas, grupo de usuarios o métricas específicas
Experiencia del usuario
Notificaciones de cuota
Los usuarios reciben comentarios claros al acercarse o alcanzar los límites de cuota:
- Estado del uso actual
- Tiempo hasta el próximo reinicio de la cuota
Mensajes de error
Cuando se excede una cuota, los usuarios ven:
- Una notificación clara de que se ha alcanzado el límite de la cuota
- El tiempo restante hasta su próximo reinicio de cuota
Mejores prácticas
- Comience conservadoramente: Comience con cuotas más bajas y ajústelas según los patrones de uso reales
- Asignación basada en grupos: Asigne cuotas diferentes según las necesidades y funciones de los grupos de usuarios
- Supervisión regular: Revise los patrones de uso para optimizar la configuración de las cuotas
- Comunicación clara: Informe a los usuarios sobre los límites de las cuotas y los períodos de reinicio
Problemas comunes y soluciones
Problema: Los usuarios alcanzan los límites con frecuencia
Solución: Considere:
- Aumentar los límites de cuota para grupos específicos
- Reducir el período de reinicio
- Crear grupos especializados para usuarios de alto uso
Problema: Cuotas no utilizadas
Solución:
- Ajuste los límites a la baja para optimizar la asignación de recursos
- Revise las asignaciones de grupo para asegurarse de que las cuotas coincidan con las necesidades del usuario
Preguntas frecuentes
P: ¿Las cuotas no utilizadas se acumulan?
R: No, las cuotas se restablecen completamente al final de cada período.
P: ¿Pueden los diferentes modelos de LLM tener diferentes cuotas?
R: Sí, las cuotas se pueden configurar de forma independiente para cada LLM.
P: ¿Qué sucede si se configuran varias cuotas para un solo LLM?
R: Las cuotas se basan en el grupo y se aplican por usuario. Para que un usuario exceda la cuota, debe exceder la cuota en todos los grupos. Esto significa que si otorga a los administradores una cuota muy relajada y al nivel de confianza 1 una más restrictiva, la cuota de administrador se aplicará a los administradores.
P: ¿Qué sucede si no se aplica ninguna cuota a un LLM?
R: No sucederá nada especial, todo el uso de LLM no tendrá medidor.
P: ¿Qué pasa si quiero cuotas diferentes para diferentes funciones?
R: Discourse AI le permite definir múltiples LLMs que se comunican con el mismo endpoint e incluso pueden reutilizar claves. Si desea dar una cuota al asistente de IA y otra al agente de IA, defina 2 LLMs.
P: ¿Cómo elimino una cuota?
R: Elimine la cuota desde la página de configuración del modelo LLM. No hay forma de “pausar” o deshabilitar temporalmente una cuota; debe eliminarse y recrearse.


