Costos de HuggingFace TGI vs OpenAI API Endpoint

Falco · 15 Enero, 2025 15:24

Para una instancia única, será difícil superar los precios de la API, ya que con los precios de la API pagas por llamada, mientras que al ejecutar TGI, pagas por hora que el servidor está en funcionamiento.

Digamos que estás ejecutando Llama 3.1 8B en un g6.xlarge; eso te costará aproximadamente $600 al mes. Esto podría darte alrededor de 450 millones de tokens en Anthropic Claude 3.5 Haiku.

Ejecutar tu propio LLM tiene sentido cuando necesitas privacidad o escala.

Tema		Respuestas	Vistas
What Discourse AI features are FREE to use? Support ai	13	529	30 Agosto 2024
OpenAI releases GPT-4o for free to all users, including devs? Support ai	2	425	16 Mayo 2024
Discourse AI - Self-Hosted Guide Self-Hosting ai	59	14292	20 Mayo 2024
How much do you spend on OpenAI integration? General	8	1090	15 Enero 2024
Estimating cost of enabling Discourse AI for related content and search Support ai	2	173	28 Octubre 2025

Costos de HuggingFace TGI vs OpenAI API Endpoint

Temas relacionados