Support du fournisseur DeepSeek ? Que faire lorsque le fournisseur de modèle n'est pas dans la liste « Provider » ?

Salut ! Heureux d’aider :slight_smile:

À ce jour, voici les coûts du plus bas au plus élevé, par 1 million de jetons :
Gemini 1.5 Flash
Entrée : 0,075 Sortie : 0,30

Claude 3.5 Haiku
Entrée : 0,80 Sortie : 4,00

Claude 3.5 Sonnet
Entrée : 3,00 Sortie : 15,00

GPT-4o
Entrée : 2,50 Sortie : 10,00

DeepSeek-R1
Entrée : 0,55 Sortie : 2,19

Les prix des jetons ici ne tiennent pas compte de la mise en cache des invites qui peut réduire considérablement les coûts. De plus, la communauté de l’IA semble signaler de manière constante que Claude 3.5 Sonnet produit un code de meilleure qualité que les modèles d’OpenAI, bien que je pense qu’ils alternent souvent en termes de qualité.

Néanmoins, DeepSeek-R1 est le vainqueur incontesté ici car il offre non seulement le meilleur rapport qualité-prix, mais le meilleur en général. Le classement de la Chatbot Arena le confirme également, car il se classe plus haut que o1 :

Hier, DeepSeek a subi une cyberattaque massive qui a probablement rendu son API non fonctionnelle, mais je l’ai testée à nouveau et elle fonctionne maintenant. J’ai également ouvert un sujet à ce sujet

En ce qui concerne la confidentialité, DeepSeek indique clairement dans sa politique que les données sont stockées en Chine (ce qui enfreint complètement la loi européenne, par exemple), et ce n’est un secret pour personne que le PCC a accès à toutes les données des entreprises en Chine. Mais si tout cela est des données publiques, alors qui s’en soucie vraiment, puisque votre site pourrait théoriquement être aspiré/exploité de toute façon.

Heureusement, ce modèle est entièrement open source et les fournisseurs de LLM en sont conscients. Par exemple, fireworks.ai propose déjà ce modèle, bien qu’ils spéculent sur le prix, à mon avis, à 8,00 en entrée / 8,00 en sortie. L’API DeepSeek est donc certainement économique.


Dans ma communauté, j’utilise GPT-4o-mini avec RAG (il est forcé de lire un sujet pertinent avant de répondre afin de fournir une réponse plus factuelle/utile) et une ingénierie d’invite stricte. Il ne m’a jamais fait défaut et il est très bon marché à 0,15 en entrée / 0,60 en sortie. Cependant, je ne lui ferais pas vraiment confiance pour le codage – cela est certainement mieux laissé à o1-mini ou DeepSeek-R1. Habituellement, 1/3 à 1/2 de tous les jetons utilisés dans ma communauté sont mis en cache (ce que vous pouvez voir dans /admin/plugins/discourse-ai/ai-usage), ce qui réduit encore mes coûts car les jetons mis en cache sont 50 % moins chers.

Ainsi, si ma communauté utilise 2 millions de jetons d’entrée et 100 000 jetons de sortie chaque jour, mes coûts approximatifs sont :
Coût d’entrée quotidien : ~0,22 Coût de sortie quotidien : ~0,06
… multiplié par 30 jours = ~6,60 en entrée et ~1,8 en sortie = 8,40 $ par mois.

Ce n’est même pas le prix d’un déjeuner.

4 « J'aime »