Custos do HuggingFace TGI versus OpenAI API Endpoint

Falco · Janeiro 15, 2025, 3:24pm

Para uma única instância, será difícil superar os preços da API, pois com os preços da API você paga por chamada, enquanto ao executar o TGI, você paga por hora que o servidor está em execução.

Digamos que você esteja executando o Llama 3.1 8B em um g6.xlarge; isso custará aproximadamente US$ 600 por mês. Isso poderia lhe dar cerca de 450 milhões de tokens no Anthropic Claude 3.5 Haiku.

Executar seu próprio LLM faz sentido quando você precisa de privacidade ou escala.

Tópico		Respostas	Visualizações
What Discourse AI features are FREE to use? Support ai	14	401	29 de Setembro de 2024
OpenAI releases GPT-4o for free to all users, including devs? Support ai	3	384	16 de Maio de 2024
Discourse AI - Self-Hosted Guide Self-Hosting ai	61	13122	30 de Abril de 2025
How much do you spend on OpenAI integration? General	8	1011	15 de Janeiro de 2024
Self-Hosting an OpenSource LLM for DiscourseAI Self-Hosting ai	7	3506	20 de Janeiro de 2026

Custos do HuggingFace TGI versus OpenAI API Endpoint

Tópicos relacionados