Je pense que la plupart des gens utilisent un plan payant avec l’un des plus grands fournisseurs de services d’IA (il y a une liste de modèles pris en charge ici dans la documentation).
Malheureusement, je ne connais aucune option abordable pour les auto-hébergeurs - tout ce qui est basé sur GPU que je connais est dans la fourchette de prix que vous avez mentionnée, et je soupçonne que l’inférence basée sur CPU sera trop lente, même sur des machines plus puissantes.