Mis pensamientos generales son que queremos avanzar lentamente hacia la eliminación de esta matriz de decisión para la mayoría de los usuarios; en un mundo ideal, deberían poder simplemente hablar con un robot y el motor subyacente debería determinar cuál es el mejor llm para atender la solicitud.
Añade algo de sobrecarga, pero también elimina algo de parálisis de decisión que tienen los usuarios no avanzados.
¿Qué significa “actualizar suscripción” en este contexto, actualizar la suscripción a la instancia de Discourse para obtener límites más altos, o instar al administrador a reconfigurar el llm?
Hay una buena cantidad de suposiciones incorporadas aquí.