Qu'est-ce qui donne le résultat le plus raisonnable : le CPU ou la RAM ?

Jagster · Avril 29, 2023, 9:49

Je sais, des questions comme combien c’est beaucoup ou emacs est-il meilleur que vi, quand il y a nano sont difficiles et impossibles à répondre, mais quand même.

J’envisage de créer une nouvelle gouttelette chez DigitalOcean juste à cause de ces trucs d’IA. Alors, lequel offre le meilleur ratio argent/bénéfice sur un forum autrement peu fréquenté avec très peu d’argent en jeu, et quand la cible est 16 Go de RAM :

basique, 112 € — 8 cœurs Intel ou AMD
général, 126 € — 4 cœurs
optimisé pour le CPU, 168 € — 8 cœurs Intel réguliers
optimisé pour la mémoire, 84 € — 2 cœurs

(L’USD est presque le même que l’euro de nos jours)

Encore une fois — je ne sais rien — mais comme Discourse est une application dépendante du client ou quelque chose comme ça, totalement différente de WordPress basé sur PHP, elle n’a pas besoin d’autant de puissance CPU, ou suis-je complètement perdu ? Mais les solutions d’IA changent complètement la donne et nécessitent de la RAM et du CPU ?

Et la question réelle et actuelle est, bien sûr : quels sont les coûts minimums si l’on veut par exemple un bloc Sujets similaires ?

Falco · Avril 29, 2023, 4:10

Le principal problème avec la fonction IA « Sujets connexes » est que vous devez générer des plongements (embeddings) pour tous vos sujets existants. Dans les grands forums, cela prend du temps et constitue la partie « coûteuse » de l’opération. Cependant, vous n’avez besoin de le faire qu’une seule fois, vous pouvez donc utiliser des instances horaires pour payer le minimum ici.

La génération des plongements pour Meta m’a pris environ 1 heure. Vous pouvez donc, par exemple, obtenir un VPS avec une NVIDIA A100 complète pendant une heure pour l’exécuter et payer moins de 3 $ !

Une fois que vous avez généré tous ces plongements, vous n’avez qu’à générer de nouveaux plongements pour les sujets nouveaux et modifiés, et là, vous pouvez probablement vous débrouiller avec une inférence basée sur CPU.

Supposons donc que vous ayez maintenant :

Une instance (droplet) chez Digital Ocean exécutant Discourse

Pendant le remplissage initial, vous pouvez avoir :

Une instance (droplet) chez Digital Ocean exécutant Discourse
Une instance (droplet) chez Digital Ocean exécutant PostgreSQL pour stocker les plongements
Un VPS chez Vultr pour calculer rapidement les plongements

Après le remplissage initial, vous le modifiez pour avoir :

Une instance (droplet) chez Digital Ocean exécutant Discourse
Une instance (droplet) chez Digital Ocean exécutant PostgreSQL pour stocker les plongements et maintenant aussi le service de plongements

Quant à la taille de l’instance pour le point 2, une petite avec 4 Go de RAM pourrait suffire, il faudrait vérifier la quantité de RAM que le conteneur du service de plongements utilise.

merefield · Avril 29, 2023, 4:16

On peut se demander s’il existe un moyen d’empaqueter ce service avec un jeu sur Steam et d’utiliser Geforce Now pour faire le travail

Jagster · Avril 29, 2023, 4:17

Cela ne semble pas si mal en fait. Je m’attendais à quelque chose de beaucoup plus cher, en termes de RAM et de CPU.

Que diriez-vous… tout ce package est encore en développement, alors devrais-je attendre un peu plus longtemps avant de plonger dans les profondeurs

Falco · Avril 29, 2023, 4:27

Nous y travaillons activement et nous y apporterons beaucoup de changements dans les semaines à venir, à mesure que nous déploierons ce plugin chez nos clients Entreprise et recueillerons leurs commentaires.

Cela dit, dépenser moins de 10 $ pour essayer cela, fournir cette fonctionnalité à votre communauté et pouvoir donner vos premiers commentaires me semble une excellente affaire, mais cela dépend de vos contraintes d’argent et de temps.

Une chose que nous savons qui va se produire, c’est qu’actuellement nous n’utilisons que l’OP dans les embeddings des sujets connexes, et nous allons expérimenter le passage de l’OP et des réponses qui peuvent tenir à la place, ce qui signifie qu’il faudra régénérer tous les embeddings à nouveau. Cela vous coûtera 3 $ et 1 heure de votre temps à nouveau.

system · Mai 29, 2023, 4:27

This topic was automatically closed 30 days after the last reply. New replies are no longer allowed.

Sujet		Réponses	Vues
I just hit my CPU cap on the Digital Ocean 2GB/2xCPU plan Hosting	35	17609	Avril 30, 2018
How much is Discourse affected by a faster CPU? Hosting	43	22153	Décembre 24, 2019
Digital Ocean $15 vs $20, what is a better option for Discourse? Hosting	7	2032	Décembre 5, 2017
Is the 6$ DO droplet enough? Hosting	26	2792	Février 2, 2023
New Digital Ocean pricing! (Spoiler: $5 for a 1GB droplet) Hosting	21	21699	Mai 14, 2023