Penso che la maggior parte delle persone utilizzi un piano a pagamento con uno dei maggiori fornitori di servizi AI (c’è un elenco di modelli supportati qui nella documentazione).
Sfortunatamente non sono a conoscenza di opzioni convenienti per gli self-hoster: tutto ciò che è basato su GPU che conosco rientra nella fascia di prezzo che hai menzionato, e sospetto che anche l’inferenza basata su CPU sarà troppo lenta, anche su macchine più potenti.