Acho que a maioria das pessoas está usando um plano pago com um dos maiores provedores de serviços de IA (há uma lista de modelos suportados aqui na documentação).
Infelizmente, não estou ciente de nenhuma opção acessível para auto-hospedeiros - tudo o que conheço baseado em GPU está na faixa de preço que você mencionou, e suspeito que a inferência baseada em CPU será muito lenta, mesmo em máquinas mais potentes.