Activer la recherche IA a paralysé mon serveur

SubStrider · Mars 7, 2026, 11:56

J’ai activé « AI embeddings enabled » hier soir et le remplissage s’est fait en arrière-plan. Aujourd’hui, j’ai activé « AI embeddings semantic search enabled » et le CPU est monté à 100 constamment avec un énorme retard dans la file d’attente Sidekiq. La recherche a complètement cessé de fonctionner sur le serveur.

J’ai désactivé la recherche sémantique et le serveur est revenu à un CPU normal en quelques minutes avec toute la file d’attente vidée.

Alors, y a-t-il une autre façon de faire cela ou est-ce attendu ?

rburkej · Mars 8, 2026, 7:43

J’aimerais en savoir plus sur votre profil « matériel » si vous l’hébergez vous-même ; j’ai pensé faire de même sur mes serveurs, mais je ne suis pas sûr de l’impact. Ceci m’indique anecdotiquement que je devrais attendre ou élaborer un meilleur plan.

sam · Mars 9, 2026, 1:29

Ce moment où Jobs::GenerateEmbeddings est censé prendre quelques secondes à chaque fois, c’est parce que vous effectuez un appel API à un service d’intégration pour obtenir les données. Ce graphique est normal, il montre simplement que quelque chose prend du temps, un autre GPU dans le cloud effectue le travail.

Une augmentation du CPU est très inattendue, peut-être que votre configuration PG a commencé à être extrêmement sollicitée et que l’insertion de 1000 nombres ou plus d’affilée suffit à la pénaliser.

Nous avons besoin de beaucoup plus de données ici pour aider au diagnostic, quelles sont les spécifications du serveur ? Que montrent les graphiques CPU réels, quel processus consomme le CPU, quel service d’intégration utilisez-vous, etc…

Falco · Mars 9, 2026, 3:09

Je vois que vous n’avez partagé qu’un graphique de durée des tâches secondaires, et il montre qu’après avoir activé les intégrations (embeddings), Discourse effectuait correctement le remplissage (backfilling) de celles-ci.

Pouvez-vous partager plus d’informations sur votre configuration ? Quel est le fournisseur d’intégrations (embeddings provider) ? S’agit-il d’une API tierce ou l’hébergez-vous vous-même également ? Combien de sujets avez-vous ? Quelles sont les spécifications de la base de données (DB specs) ?

SubStrider · Mars 9, 2026, 11:54

Je suis sur un serveur DO 16 Go de mémoire / 4 vCPUs Intel. J’utilise Open AI text-embedding-3-small.

L’utilisation du CPU est généralement d’environ 50 % ou moins. Voici comment cela s’est passé lorsque j’ai activé la recherche sémantique. Il y a environ 2,5 millions de publications et 250 000 sujets. Je n’ai pas activé les intégrations pour les MP, sinon cela ajouterait 1 million de publications et 100 000 sujets supplémentaires.

Sujet		Réponses	Vues
Getting a lot of no results for semantic search Support ai-search , ai	21	438	Avril 12, 2025
Is header semantic search still experimental? Support ai-search , ai	9	129	Octobre 14, 2024
Discourse AI - Embeddings Site Management ai , ai-search , related-topics	24	6509	Octobre 15, 2025
Semantic quick search gives error 500 Support ai-search , ai	2	355	Avril 5, 2024
Estimating cost of enabling Discourse AI for related content and search Support ai	3	110	Octobre 28, 2025

Activer la recherche IA a paralysé mon serveur

Sujets connexes