Configurar cuotas de uso de LLM en Discourse AI

sam · 21 Enero, 2025 06:04

Esta guía explica cómo configurar y gestionar las cuotas de uso para los modelos de lenguaje grande (LLM) en Discourse AI.

Nivel de usuario requerido: Administrador

Resumen

Las cuotas de uso de LLM permiten a los administradores controlar y supervisar el consumo de recursos de IA estableciendo límites en el uso de tokens y las interacciones para diferentes grupos de usuarios. Esto ayuda a mantener la eficiencia de costos mientras garantiza un acceso equitativo a las funciones de IA en toda la comunidad.

Configuración

Acceso a la configuración de cuotas

Dirígete al panel de administración de tu sitio.
Ve a Admin > Plugins > Discourse AI > LLMs.
Selecciona el modelo de LLM que deseas configurar.

Configuración de cuotas

Para cada grupo de usuarios, puedes configurar:

Uso máximo de tokens
Y/o número máximo de interacciones con IA
Y/o costo máximo
Duración del período de reinicio

Al menos uno de los valores máximos de tokens o de usos debe estar configurado para cada cuota.

Nota: No se puede asignar una cuota al grupo “everyone” (todos). Debes utilizar grupos específicos (por ejemplo, grupos de nivel de confianza o grupos personalizados).

Opciones de duración

Elige entre períodos de reinicio predefinidos:

1 hora
6 horas
24 horas
7 días
Duración personalizada (especificada en horas)

Supervisión del uso

Visualización de estadísticas

Los administradores pueden supervisar el consumo de tokens y el uso en: https://NOMBRE_DEL_SITIO/admin/plugins/discourse-ai/ai-usage

Dirígete a Admin > Plugins > Discourse AI.
Selecciona la pestaña “Usage” (Uso).
Filtra por rango de fechas, grupo de usuarios o métricas específicas.

Experiencia del usuario

Notificaciones de cuota

Los usuarios reciben comentarios claros cuando se acercan o alcanzan los límites de la cuota:

Estado actual del uso
Tiempo hasta el próximo reinicio de la cuota

Mensajes de error

Cuando se excede una cuota, los usuarios ven:

Una notificación clara de que se ha alcanzado el límite de la cuota.
El tiempo restante hasta el próximo reinicio de su cuota.

Mejores prácticas

Comienza de forma conservadora: Empieza con cuotas más bajas y ajústalas según los patrones de uso reales.
Asignación basada en grupos: Asigna diferentes cuotas según las necesidades y roles de los grupos de usuarios.
Supervisión regular: Revisa los patrones de uso para optimizar la configuración de las cuotas.
Comunicación clara: Informa a los usuarios sobre los límites de las cuotas y los períodos de reinicio.

Problemas comunes y soluciones

Problema: Los usuarios alcanzan los límites con frecuencia

Solución: Considera:

Aumentar los límites de cuota para grupos específicos.
Reducir el período de reinicio.
Crear grupos especializados para usuarios de alto consumo.

Problema: Cuotas sin usar

Solución:

Ajusta los límites hacia abajo para optimizar la asignación de recursos.
Revisa las asignaciones de grupos para asegurarte de que las cuotas se ajusten a las necesidades de los usuarios.

Preguntas frecuentes

P: ¿Las cuotas no utilizadas se acumulan?
R: No, las cuotas se reinician completamente al final de cada período.

P: ¿Pueden diferentes modelos de LLM tener diferentes cuotas?
R: Sí, las cuotas se pueden configurar de forma independiente para cada LLM.

P: ¿Qué ocurre si se establecen varias cuotas para un solo LLM?
R: Las cuotas se basan en grupos y se aplican por usuario. Para que un usuario exceda la cuota, debe exceder la cuota en todos los grupos. Esto significa que si asignas una cuota muy flexible a los administradores y una más restrictiva al nivel de confianza 1, se aplicará la cuota de administrador a los administradores.

P: ¿Qué ocurre si no se aplica ninguna cuota a un LLM?
R: No ocurrirá nada especial; todo el uso del LLM será sin medición.

P: ¿Qué hago si quiero diferentes cuotas para diferentes funciones?
R: Discourse AI te permite definir múltiples LLM que contactan el mismo punto final e incluso pueden reutilizar claves. Si deseas asignar una cuota al asistente de IA y otra diferente al agente de IA, define 2 LLM.

P: ¿Cómo elimino una cuota?
R: Elimina la cuota desde la página de configuración del modelo de LLM. No hay forma de “pausar” o desactivar temporalmente una cuota; debe eliminarse y crearse nuevamente.

Recursos adicionales

lava · 21 Enero, 2025 06:37

Parece que no podemos prohibir completamente que un grupo use un modelo específico estableciendo la cuota en 0.

¿Podrías añadir soporte para esta configuración?

sam · 21 Enero, 2025 06:40

Lo siento, ¿puedes ampliar aquí? Cada función también está restringida por grupo, por lo que de todos modos solo puedes habilitar el asistente para un subconjunto de usuarios.

lava · 21 Enero, 2025 06:50

Quiero que algunos modelos premium estén restringidos solo a grupos específicos. Sería genial si pudiéramos establecer la cuota de un modelo en 0 para deshabilitar el acceso a ciertos grupos.

sam · 21 Enero, 2025 06:53

Sí, es un problema interesante. Lo pensaré.

Es posible que desees que el asistente use GPT4o para el “grupo especial 1” y GPT4o mini para el resto de las personas.

En este momento, solo te permitimos seleccionar un modelo para el asistente de IA, por lo que necesitaríamos un cambio bastante grande para admitir esto.

@Falco / @Saif / @awesomerobot, algo en lo que pensar.

Tema		Respuestas	Vistas
LLM Quotas for Discourse AI Announcements ai	0	175	21 Enero 2025
Limit the number of AI tokens a user can use in a day? Feature completed , ai	11	938	3 Abril 2025
Making the case for a hard cap feature on user group AI usage for AI bots and AI Helper Feature chat , completed , ai , ai-bot	11	427	21 Enero 2025
Balancing Costs and Functionality in AI-Powered Forums Feature ai , ai-bot	4	842	21 Enero 2025
Discourse AI - Large Language Model (LLM) settings page Site Management how-to , ai	20	3848	9 Mayo 2026