Esiste una diagnostica passo passo per quando un sito Discourse si trova in un 502 Bad Gateway?

TonyG · 23 Gennaio 2024, 6:15pm

Sono venuto qui sperando di trovare una diagnosi passo passo per quando un sito Discourse si trova in una condizione 502 Bad Gateway. Sembra che le uniche opzioni siano del tipo:

L’aggiornamento di Discourse potrebbe essere fallito, usa ./launcher rebuild app.
Aggiorna e riavvia il server.

Queste sono il tipo di risposte che otteniamo da un tecnico di supporto di livello 1, o da un bot email.

Cos’altro possiamo fare per esaminare i log e vedere esattamente perché l’ambiente è morto? Con queste informazioni potremmo imparare come prevenire il problema in futuro.

Ad esempio, sarebbe appropriato creare uno script cron per eseguire periodicamente un ping a Discourse e, se la risposta è un codice di ritorno 502 o simile, ricostruire automaticamente?

La ricostruzione sembra anche un modo piuttosto brutale per risolvere un problema. Non è una diagnosi.

Spero davvero che qualcuno possa indicarci un documento popolare “Diagnosi dei problemi di Discourse” che noi “dummies” ci siamo persi.

Grazie!

Firepup650 · 23 Gennaio 2024, 6:24pm

Leggendo molti post qui, tipicamente gli amministratori del forum non sono la causa dei 502, e si tratta di un errore di plugin/core. Quindi non ci sarebbe molto che tu possa fare per evitare questi problemi.

I log della console aiutano sempre, possono individuare il plugin problematico molte volte.

TonyG · 23 Gennaio 2024, 7:08pm

Posso aprire la console su questo VPS ma la finestra di testo è limitata.
Ci sono log specifici che possono essere controllati nel container o nel sistema operativo?
Esiste già una qualche forma di processo di ping nel sistema operativo host o nel container che rileva quando i processi sono inattivi?
Un semplice riavvio del server all’interno del container potrebbe essere un buon modo per affrontare questo problema piuttosto che una ricostruzione completa?

A proposito, sto eseguendo l’ultima versione beta/dev, quindi è del tutto possibile che un aggiornamento recente abbia messo fuori servizio il server, come abbiamo visto in passato. Al momento non ricordo se ci siano plugin non predefiniti installati.

Ho la libertà di aiutare con la diagnostica di questo problema senza che la nostra community si arrabbi, anche se entro alcuni mesi dovremo passare a versioni più stabili solo per mettere a proprio agio i nostri utenti. Quindi, se si tratta di qualcosa nella build, sono felice di aiutare a trovarlo.

Grazie!

Firepup650 · 23 Gennaio 2024, 8:28pm

Intendevo i log del browser, dagli strumenti per sviluppatori o dall’equivalente nel tuo browser.

Non credo, ma puoi sempre provare.

pfaffman · 24 Gennaio 2024, 12:37am

Il disco è pieno?

Succede spesso?

Controlla /var/discourse/logs/rails/production.log

TonyG · 30 Marzo 2024, 2:31am

Mi scuso per il ritardo nel rispondere…

Disco utilizzato <50%.
La RAM tende a rimanere nell’intervallo 80-90%, Swap <40%. Suppongo che sia qui che si verifichi il problema.
I log si trovano in /var/discourse/shared/standalone/log/rails.
production.log e i file gzip correlati contengono molti dettagli sulle transazioni. Cosa potrei cercare?
Non ci sono voci in production_error.log.
“Frequentemente”? No. Ma abbastanza spesso da essere leggermente fastidioso e indurmi a scrivere qui.
Ho esaminato syslog e non ho visto nulla - non sono sicuro che ci sarebbe qualcosa lì se il problema fosse limitato al container, come dovrebbe essere.

Sono un principiante di Docker, quindi mi dispiace di non avere informazioni dal container, ma sarò felice di fare ciò che mi verrà indicato.

Grazie!

merefield · 30 Marzo 2024, 7:48am

Questo non aiuterà. Il problema è il backend. Non arriva nemmeno a ricevere una risposta dal server (da cui “bad gateway”)

Sono i log di rails del backend che devi controllare.

Prova le azioni:

/var/discourse/shared/standalone/log/rails# tail -n 200 production.log per vedere se ci sono errori di avvio evidenti
nel container (prima ./launcher enter app):

curl 0.0.0.0:3000 per vedere se il server rails sta rispondendo.

Altrimenti rimuovi tutti i plugin, ricompila e poi aggiungili iterativamente.

pfaffman · 30 Marzo 2024, 12:46pm

502 si verifica quando rails non restituisce una risposta, solitamente quando il sistema si sta avviando o qualcosa è configurato in modo errato.

Potresti controllare i log di nginx.

Ed_S · 30 Marzo 2024, 1:16pm

Penso che quasi tutti i thread qui sugli errori 502 si verifichino quando Discourse è stato aggiornato e non è tornato in vita. L’aggiornamento è fallito, o l’amministratore non ha aspettato abbastanza a lungo che il servizio si avviasse.

Stai dicendo che hai un Discourse funzionante, non intraprendi alcuna azione amministrativa, ma inizia a restituire 502 spontaneamente?

E quando lo fa, restituisce sempre 502 fino al riavvio o funziona di nuovo in modo intermittente?

Argomento		Risposte	Visualizzazioni
How to track down failure of discourse upstream inside container resulting in 502 Bad Gateway Self-hosting	7	1219	Aprile 23, 2023
502 Bad Gateway after updating to latest version Support	11	322	Aprile 29, 2025
Brand new install, shows only "502 Bad Gateway" Support	2	96	Marzo 17, 2025
502 Bad Gateway after Update Support	3	919	Dicembre 22, 2018
502 Bad Gateway - Newbie help needed Self-hosting	4	591	Novembre 15, 2018

Esiste una diagnostica passo passo per quando un sito Discourse si trova in un 502 Bad Gateway?

Argomenti correlati