Tarification des fournisseurs de LLM pour Discourse AI

Discourse · Novembre 16, 2023, 6:06

Discourse AI nécessite la liaison à un fournisseur LLM - ceci est une référence aux tarifs des différentes options.

Niveau utilisateur requis : Administrateur

Pour utiliser certaines fonctionnalités de Discourse AI, les utilisateurs doivent utiliser un fournisseur tiers de modèle linguistique étendu (LLM). Veuillez consulter chaque fonctionnalité d’IA pour déterminer quels LLM sont compatibles.

Le guide suivant renvoie aux tarifs des différents fournisseurs de LLM.

Notez que les coûts peuvent varier en fonction de plusieurs facteurs tels que le nombre de requêtes, la longueur du texte, les ressources informatiques utilisées, les modèles choisis, etc. Pour les tarifs les plus à jour et les plus précis, consultez régulièrement chaque fournisseur.

Tarifs OpenAI GPT
Tarifs Anthropic Claude
Google Gemini
Azure OpenAI
AWS Bedrock avec accès Anthropic
Points d’accès HuggingFace avec modèle de type Llama2
Exécutez votre propre modèle de type Llama2 OSS avec TGI : Le coût de l’exécution de votre propre modèle de type Llama2 OSS avec TGI dépendrait de divers facteurs tels que les coûts d’infrastructure, les coûts associés au réglage fin du modèle, et les coûts de gestion et de maintenance du modèle.

Jagster · Novembre 17, 2023, 5:51

Ce n’est certainement pas une comparaison acquise statistiquement, mais sur la base de mes courts tests, l’utilisation d’OpenAI GPT-4 est trois fois plus chère que GPT-3.5 Turbo, en comptant les appels API et le nombre de tokens utilisés — et comme les tokens utilisés par GPT-4 sont plus chers, la différence est beaucoup plus grande.

Et je n’ai eu aucun avantage avec GPT-4 par rapport à 3.5 Turbo.

Et comme avertissement : j’ai utilisé le finnois, donc l’anglais peut être différent. De plus, toute IA est totalement inutile en utilisation de chat lorsqu’elle est utilisée en finnois, mais c’est une tout autre histoire — mais cela signifie, de mon point de vue, que tous les chatbots sont une pure perte d’argent lorsqu’ils sont utilisés pour de petites langues.

Saif · Novembre 20, 2023, 3:03

Les coûts ici sont estimés et il est entendu que les coûts peuvent varier considérablement en fonction de l’utilisation !

Il est important de noter que pour de nombreuses tâches de base, la différence entre les modèles GPT-4 et GPT-3.5 peut ne pas être significative. Cependant, GPT-4 présente des différences substantielles en termes de capacités, de compréhension créative et d’entrée brute.

Je suis également d’accord que pour les langues qui ne sont pas populaires, les capacités du modèle laissent beaucoup à désirer.

Jagster · Novembre 20, 2023, 10:43

Je pense que nous parlons de la même chose, mais pour être sûr : c’est un problème des entreprises d’IA et vous, moi ou n’importe quel développeur ne pouvons pas changer ce fait.

Mais je cherche quelque chose comme nous devrions tous un peu surveiller combien nous dépensons (si nous n’utilisons pas d’argent d’un autre budget que le nôtre ) et essayer de trouver un équilibre entre l’utilité très subjective et l’argent.

Et non, je ne sais pas de quoi je parle. Principalement parce que les réponses de tous les chatbots sont essentiellement basées sur le buzz anglais de millions de vols (quantité plutôt que qualité). La situation peut changer - en mieux ou en pire, cela dépend - si nous avons de meilleurs outils pour éduquer l’IA sur les sources qu’elle peut utiliser. Bien sûr, nous en avons, mais cela coûtera beaucoup plus cher que le prix des jetons.

Et oui, c’est le casse-tête des petits acteurs.

Je me demande… y a-t-il une chance que nous obtenions un meilleur équilibre coût/précision avec une édition de prompt plus libre ?

Tris20 · Mars 22, 2024, 12:32

Seriez-vous à l’aise pour divulguer approximativement le coût actuel pour Meta ? Même une estimation approximative ou une fourchette serait utile.

J’ai demandé au bot de donner une estimation et il a fourni ce qui suit :

Forum Helper Bot:

Hypothèses pour le calcul :

Longueur moyenne des publications : On suppose qu’une publication moyenne contient environ 50 jetons (en tenant compte du mélange de publications plus courtes et plus longues).

Actions activées par l’IA par publication : Si l’IA aide à la composition, au résumé ou à la réponse aux requêtes, supposons qu’elle est engagée deux fois par publication (une fois pour rédiger une réponse et peut-être une fois pour des tâches supplémentaires comme le résumé).

Utilisateurs actifs quotidiens et publications : Meta Discourse a un niveau d’engagement élevé. Pour une approximation, supposons qu’il y a environ 100 utilisateurs actifs par jour, chacun générant en moyenne 4 publications/commentaires (totalisant 400 interactions quotidiennes).

Activité mensuelle : Cela se traduit par 12 000 interactions mensuelles (400 interactions * 30 jours).

Utilisation totale des jetons : En supposant que chaque action de l’IA implique le traitement de 100 jetons (50 jetons pour la lecture/entrée + 50 pour la génération de sortie), et que l’IA est utilisée deux fois par publication, cela fait 200 jetons par publication. Par conséquent, l’utilisation mensuelle des jetons serait de 2,4 millions de jetons (12 000 interactions * 200 jetons).

Estimation des coûts :

En prenant le modèle GPT-3.5 comme référence, qui coûtait environ 0,02 $ par 1 000 jetons vers la fin de mes données d’entraînement :

Coût mensuel : Le coût pour 2,4 millions de jetons serait d’environ 48 (2 400 * 0,02 ).

Je pense que ce chiffre est trop bas, mais en excluant le travail expérimental et l’utilisation par l’équipe, etc., peut-être que ce n’est pas loin de ce que la plupart des instances de taille similaire à Meta pourraient attendre ?

Jagster · Avril 1, 2024, 7:09

Une autre question stupide, mais les mathématiques elles-mêmes sont-elles valides ? Je demande juste parce que les LLM ne savent tout simplement pas compter.

Mon forum utilise beaucoup moins de choses d’IA (via OpenAI) et mes frais dépassent cela.

bryce · Avril 2, 2024, 4:51

Le prix du token que le bot a mentionné n’est pas exact. Le prix actuel pour gpt-3.5-turbo-0125 est de 0,50 par 1 million de tokens d'entrée et de 1,50 par 1 million de tokens de sortie. En supposant la moitié d’entrée et la moitié de sortie, 2,4 millions de tokens ne devraient coûter que 2,40 . `gpt-4` coûte 30 /m en entrée et 60 /m en sortie, ce qui reviendrait à 108 pour 2,4 millions de tokens.

sam · Avril 2, 2024, 5:00

Claude Haiku se rapproche de la performance de GPT-4 et coûte la moitié du prix de GPT-3.5.

Je pense qu’il faut une raison très convaincante pour utiliser 3.5 plutôt que Claude 3 Haiku.

@Saif, peux-tu mettre à jour le message initial avec les derniers prix de Claude ? Le message initial est très dépassé.

Je ne suis pas sûr que cela vaille la peine de mentionner les prix réels car ils changent si souvent.

Saif · Avril 2, 2024, 7:21

Mis à jour le OP pour n’avoir que les liens, je suis d’accord que les prix changent constamment et qu’il est préférable d’obtenir les informations les plus à jour.

Saif · Novembre 4, 2024, 9:01

Avec l’ensemble toujours croissant de fournisseurs et de LLM, il est préférable que les utilisateurs vérifient directement auprès du fournisseur. Nous supprimons donc ce sujet.

Sujet		Réponses	Vues
Estimating costs of using LLMs for Discourse AI Site Management how-to , price-sensitive , ai	2	851	Novembre 14, 2024
Discourse AI - AI usage Site Management how-to , ai	0	407	Janvier 23, 2025
What Discourse AI features are FREE to use? Support ai	14	375	Septembre 29, 2024
What LLM to use for Discourse AI? Site Management how-to , ai	0	711	Janvier 23, 2025
Estimating cost of enabling Discourse AI for related content and search Support ai	3	66	Octobre 28, 2025

Tarification des fournisseurs de LLM pour Discourse AI

Sujets connexes