Abilitare la ricerca AI ha paralizzato il mio server

SubStrider · 7 Marzo 2026, 11:56am

Ho abilitato “AI embeddings enabled” ieri sera e il riempimento è avvenuto in background. Oggi ho abilitato “AI embeddings semantic search enabled” e la CPU è salita al 100% costantemente con un enorme arretrato nella coda di sidekiq. La ricerca ha smesso di funzionare completamente sul server.

Ho disabilitato la ricerca semantica e il server è tornato alla normalità della CPU in pochi minuti con tutta la coda svuotata.

Quindi c’è un modo per farlo diversamente o è questo il comportamento previsto?

rburkej · 8 Marzo 2026, 7:43pm

Mi piacerebbe saperne di più sul tuo profilo “hardware” se fai self-hosting; ho pensato di fare lo stesso sui miei server, ma non sono sicuro dell’impatto. Questo mi dice aneddoticamente che dovrei aspettare o elaborare un piano migliore.

sam · 9 Marzo 2026, 1:29am

Quella volta Jobs::GenerateEmbeddings dovrebbe richiedere secondi per colpo, perché stai effettuando una chiamata API a un servizio di embedding per ottenere i dati. Quel grafico è normale, mostra solo che qualcosa sta richiedendo tempo, un’altra GPU nel cloud sta effettivamente eseguendo il lavoro.

L’aumento della CPU è molto inaspettato, forse la tua configurazione PG ha iniziato ad essere estremamente sotto stress di risorse e inserire circa 1000 numeri di seguito è sufficiente per danneggiarla.

Abbiamo bisogno di molti più dati qui per aiutare a diagnosticare, quali sono le specifiche del server? Cosa mostrano i grafici CPU effettivi, quale processo sta consumando la CPU, quale servizio di embedding stai utilizzando, ecc…

Falco · 9 Marzo 2026, 3:09am

Vedo che hai condiviso solo un grafico della durata del lavoro di sidekick, e mostra che dopo aver abilitato gli embeddings Discourse stava correttamente riempiendo quelli arretrati.

Puoi condividere maggiori informazioni sulla tua configurazione? Qual è il fornitore degli embeddings? È un’API di terze parti o la stai anche auto-ospitando? Quanti argomenti hai? Quali sono le specifiche del database?

SubStrider · 9 Marzo 2026, 11:54am

Sono su un server DO con 16 GB di memoria / 4 vCPU Intel. Utilizzo text-embedding-3-small di OpenAI.

L’utilizzo della CPU è solitamente intorno al 50% o meno. Questo è ciò che è successo quando ho abilitato la ricerca semantica. Ci sono circa 2,5 milioni di post e 250 mila argomenti. Non ho abilitato gli embedding per i messaggi privati (PM), altrimenti aggiungerebbero altri 1 milione di post e 100 mila argomenti.

Argomento		Risposte	Visualizzazioni
Getting a lot of no results for semantic search Support ai-search , ai	21	438	Aprile 12, 2025
Is header semantic search still experimental? Support ai-search , ai	9	129	Ottobre 14, 2024
Discourse AI - Embeddings Site Management ai , ai-search , related-topics	24	6509	Ottobre 15, 2025
Semantic quick search gives error 500 Support ai-search , ai	2	355	Aprile 5, 2024
Estimating cost of enabling Discourse AI for related content and search Support ai	3	110	Ottobre 28, 2025

Abilitare la ricerca AI ha paralizzato il mio server

Argomenti correlati