Quella volta Jobs::GenerateEmbeddings dovrebbe richiedere secondi per colpo, perché stai effettuando una chiamata API a un servizio di embedding per ottenere i dati. Quel grafico è normale, mostra solo che qualcosa sta richiedendo tempo, un’altra GPU nel cloud sta effettivamente eseguendo il lavoro.
L’aumento della CPU è molto inaspettato, forse la tua configurazione PG ha iniziato ad essere estremamente sotto stress di risorse e inserire circa 1000 numeri di seguito è sufficiente per danneggiarla.
Abbiamo bisogno di molti più dati qui per aiutare a diagnosticare, quali sono le specifiche del server? Cosa mostrano i grafici CPU effettivi, quale processo sta consumando la CPU, quale servizio di embedding stai utilizzando, ecc…