¿Hay un diagnóstico paso a paso para cuando un sitio de Discourse se encuentra en un 502 Bad Gateway?

TonyG · 23 Enero, 2024 18:15

Vine aquí esperando encontrar un diagnóstico paso a paso para cuando un sitio de Discourse se encuentra en una condición de 502 Bad Gateway. Parece que las únicas opciones son del tipo:\n\n1) La actualización de Discourse podría haber fallado, usa ./launcher rebuild app.\n2) Actualiza y reinicia el servidor.\n\nEstas son el tipo de respuestas que obtenemos de un técnico de soporte de nivel 1, o de un bot de correo electrónico.\n\n¿Qué más podemos hacer para revisar los registros y ver exactamente por qué murió el entorno? Con esa información podríamos aprender a prevenir el problema en el futuro.\n\nPor ejemplo, ¿sería apropiado programar un proceso cron para hacer ping ocasionalmente a Discourse y, si la respuesta es un código de retorno 502 o similar, reconstruir automáticamente?\n\nReconstruir parece una forma bastante brutal de resolver un problema. No es un diagnóstico.\n\nRealmente espero que alguien pueda indicarnos un documento popular de "Diagnóstico de problemas de Discourse" que los tontos como yo se hayan perdido. \n\n¡Gracias!

Firepup650 · 23 Enero, 2024 18:24

Por leer muchas publicaciones aquí, normalmente los administradores del foro no son la causa de los 502, y es un error de plugin/núcleo. Así que no habría mucho que pudieras hacer para evitar esos problemas.

Los registros de la consola siempre ayudan, a menudo pueden señalar el plugin problemático.

TonyG · 23 Enero, 2024 19:08

Puedo abrir la consola en este VPS pero la ventana de texto es limitada.
¿Hay registros específicos que se puedan revisar en el contenedor o en el sistema operativo?
¿Ya existe algún tipo de proceso de ping en el sistema operativo anfitrión o en el contenedor que detecte cuándo los procesos están inactivos?
¿Podría un simple reinicio del servidor dentro del contenedor ser una buena manera de abordar esto en lugar de una reconstrucción completa?

Por cierto, estoy ejecutando la última versión beta/dev, por lo que es totalmente posible que una actualización reciente haya caído el servidor, como hemos visto en el pasado. No recuerdo en este momento si hay algún plugin no predeterminado instalado.

Tengo la libertad de ayudar con el diagnóstico de esto sin que nuestra comunidad se moleste, aunque dentro de unos meses necesitaremos pasar a versiones más estables solo para mantener cómodos a nuestros usuarios. Así que si esto es algo en la compilación, estaré feliz de ayudar a encontrarlo.

¡Gracias!

Firepup650 · 23 Enero, 2024 20:28

Me refería a los registros del navegador, de las herramientas de desarrollador o el equivalente en tu navegador.

No lo creo, pero siempre puedes intentarlo.

pfaffman · 24 Enero, 2024 00:37

¿Está lleno el disco?

¿Sucede esto con frecuencia?

Mira /var/discourse/logs/rails/production.log

TonyG · 30 Marzo, 2024 02:31

Disculpa por tardar tanto en responder…

El disco está en uso <50%.
La RAM tiende a permanecer en el rango 80-90%, el Swap <40%. Supongo que aquí es donde se origina el problema.
Los registros están en /var/discourse/shared/standalone/log/rails.
production.log y los archivos comprimidos relacionados tienen muchos detalles de transacciones. ¿Qué podría buscar?
No hay ninguna entrada en production_error.log.
¿“Frecuentemente”? No. Pero lo suficientemente a menudo como para ser un poco molesto y animarme a publicar aquí.
Revisé syslog y no vi nada; no estoy seguro de que hubiera algo allí si el problema está restringido al contenedor, como debería ser.

Soy un novato en Docker, así que lamento no tener información del contenedor, pero estaré feliz de seguir las instrucciones.

¡Gracias!

merefield · 30 Marzo, 2024 07:48

Esto no ayudará. El problema está en el backend. Ni siquiera llega a recibir una respuesta del servidor (de ahí lo de “bad gateway”).

Son los registros de rails del backend los que necesitas revisar.

Prueba las acciones:

/var/discourse/shared/standalone/log/rails# tail -n 200 production.log para ver si hay errores obvios de inicio.
en el contenedor (primero ./launcher enter app):

curl 0.0.0.0:3000 para ver si el servidor de rails está respondiendo.

Por lo demás, elimina todos los plugins, reconstruye y luego añádelos de nuevo iterativamente.

pfaffman · 30 Marzo, 2024 12:46

El error 502 ocurre cuando Rails no devuelve una respuesta, generalmente cuando el sistema se está iniciando o algo está mal configurado.

Podrías revisar los registros de nginx.

Ed_S · 30 Marzo, 2024 13:16

Creo que casi todos los hilos aquí sobre errores 502 ocurren cuando Discourse ha sido actualizado y no ha vuelto a la vida. La actualización falló, o el administrador no esperó el tiempo suficiente para que el servicio se iniciara.

¿Estás diciendo que tienes un Discourse funcionando, no realizas ninguna acción administrativa, pero empieza a devolver 502 espontáneamente?

Y cuando lo hace, ¿siempre devuelve 502 hasta que se reinicia o funciona intermitentemente de nuevo?

Tema		Respuestas	Vistas
How to track down failure of discourse upstream inside container resulting in 502 Bad Gateway Self-hosting	7	1219	23 Abril 2023
502 Bad Gateway after updating to latest version Support	11	322	29 Abril 2025
Brand new install, shows only "502 Bad Gateway" Support	2	96	17 Marzo 2025
502 Bad Gateway after Update Support	3	919	22 Diciembre 2018
502 Bad Gateway - Newbie help needed Self-hosting	4	591	15 Noviembre 2018

¿Hay un diagnóstico paso a paso para cuando un sitio de Discourse se encuentra en un 502 Bad Gateway?

Temas relacionados