La próxima semana explicaré la integración de Discourse AI al equipo. Ya tenemos algunas claves de API, PERO, todas son para cuentas DE PAGO.
Estoy seguro de que me preguntarán: ¿Hay alguna característica que se pueda integrar y que se pueda usar de forma gratuita? Esto es para una escuela y estamos seguros de que los estudiantes querrán usar todo, pero los costos serán astronómicos.
Gracias
En realidad, llama3 es gratis, pero por lo que puedo entender, se necesita una computadora de $300,000 para ejecutarlo.
Si tienes algo de presupuesto, podrías configurarlo de tal manera que pagues esa cantidad mensualmente al servicio que quieras pagar y, cuando se agote para el mes, se agote para el mes. Intentarías establecer límites para que no sucediera la primera semana (o día). Sería complicado configurarlo de tal manera que los maestros que quisieran usarlo como parte de la clase pudieran contar con él.
Como escuela, tal vez puedan registrarse para obtener créditos educativos gratuitos en servicios como AWS, Azure o GCP y usarlos para potenciar las funciones de IA de Discourse.
Por si sirve de algo, puedes ejecutar la versión 70b de Llama3 con 48 GB de VRAM, que puedes conseguir relativamente fácil con un par de Nvidia RTX 3090 usadas de eBay por unos 750 dólares cada una. Montar el resto de un sistema para soportarlo costaría alrededor de 3000 dólares, espero.
Gemini Flash es muy barato y la API de DeepSeek es tan barata que es casi gratis.
Si necesitas ejecutar localmente, puedes construir una máquina por menos de $1000 que pueda ejecutar modelos Llama. Construí una máquina 4xP100 por $1000 que tiene 64 GB de VRAM. Pero una máquina 2xP40 con 48 GB de VRAM sería suficiente para ejecutar Llama 70B y se puede construir por $600 si compras piezas de segunda mano.
Para lo último en economía, podrías ejecutar en una sola GPU P40 con cuantización AQLM, pero esto sería bastante lento (~1 tok/s).
Interesante que nadie esté teniendo en cuenta los costos de electricidad para todas estas soluciones de autoalojamiento. Supongo que esa es una factura consolidada que de todos modos no se puede rastrear hasta una máquina específica…
Acabas de tocar un tema que un amigo que trabaja para una empresa de servicios públicos mencionó el otro día como consecuencia del trabajo remoto. Las unidades de aire acondicionado/calefacción ahora funcionan sin parar porque la gente tiene que usarlas sin parar. El resultado han sido facturas de servicios públicos astronómicas para muchos.