GPT-4 o 3.5 no se pueden autoalojar.
Algunos LLM son de código abierto como Falcon o varios modelos basados en LLaMA (que vienen con preguntas de licencia) se pueden autoalojar, pero hasta la fecha todos tienen un rendimiento inferior a GPT 4 o incluso 3.5.
Tu cálculo de servilleta está muy equivocado, si vas a autoalojar un LLM probablemente querrás una A100 o H100, quizás unas cuantas… intenta buscar los precios en Google…