HuggingFace TGI 与 OpenAI API 终端成本对比

Falco · 2025 年1 月 15 日 15:24

对于单个实例，很难在 API 定价方面做得更好，因为使用 API 定价时，您按调用次数付费，而运行 TGI 时，您按服务器运行的小时数付费。

假设您在 g6.xlarge 上运行 Llama 3.1 8B；这大约需要 600 美元/月。这可以为您提供约 4.5 亿个 Anthropic Claude 3.5 Haiku 的 token。

当您需要隐私或规模时，运行自己的 LLM 才是有意义的。

话题		回复	浏览量
What Discourse AI features are FREE to use? Support ai	14	342	2024 年9 月 29 日
OpenAI releases GPT-4o for free to all users, including devs? Support ai	3	372	2024 年5 月 16 日
Discourse AI - Self-Hosted Guide Self-Hosting ai	61	12411	2025 年4 月 30 日
How much do you spend on OpenAI integration? General	8	963	2024 年1 月 15 日
Estimating cost of enabling Discourse AI for related content and search Support ai	2	46	2025 年10 月 28 日