Parece que no hay tiempos de espera configurados para las copias de seguridad. Así, una copia de seguridad automática quedó bloqueada desde septiembre.
Una vez cancelada, todos nuestros usuarios recibieron resúmenes por correo electrónico y restablecimientos de contraseña acumulados desde septiembre.
Aquí está el registro:
[2019-09-26 03:35:25] pg_dump: creando INDEX "public.idx_tag_users_ix1"
[2019-09-26 03:35:25] pg_dump: creando INDEX "public.idx_tag_users_ix2"
[2019-09-26 03:35:25] pg_dump: creando INDEX "public.idx_topic_id_public_type_deleted_at"
[2019-09-26 03:35:25] pg_dump: creando INDEX "public.idx_topics_front_page"
[2019-09-26 03:35:25] pg_dump: creando INDEX "public.idx_topics_user_id_deleted_at"
[2019-09-26 03:35:25] pg_dump: creando INDEX "public.idx_unique_actions"
[2019-09-26 03:35:25] pg_dump: creando INDEX "public.idx_unique_flags"
[2019-09-26 03:35:25] Finalizando copia de seguridad...
[2019-09-26 03:35:25] Creando archivo comprimido: our-community-2019-09-26-033520-v20171214040346.tar.gz
[2019-09-26 03:35:25] Verificando que el archivo comprimido no exista previamente...
[2019-09-26 03:35:25] pg_dump: creando INDEX "public.idx_unique_post_uploads"
[2020-01-24 16:02:39] ¡El proceso de copia de seguridad fue cancelado!
[2020-01-24 16:02:39] Notificando a 'system' sobre el final de la copia de seguridad...
Esto es muy extraño. Hay un mensaje de registro suelto de “pg_dump” después del mensaje “Finalizando copia de seguridad…”.
Además, no estoy seguro de por qué el sistema dejó de enviar correos electrónicos. Sidekiq ya debería estar despausado cuando aparece “Finalizando copia de seguridad…” en los registros.
¿Qué versión de Discourse estás utilizando? Asumo que no has ejecutado ninguna actualización desde septiembre, de lo contrario, estoy bastante seguro de que eso habría detenido la copia de seguridad.
¡Gracias por leer y responder! Noté el problema al inspeccionar un servidor antiguo, que ya ha sido reemplazado. Todavía tengo acceso a la instancia antigua.
Ocurrió en la versión 1.8
Los únicos correos enviados fueron los de new_version. No hubo restablecimientos de contraseña ni notificaciones.
Los registros se escriben y vacían a menudo en diferentes hilos o procesos, así que no estoy seguro de si eso podría explicar el mensaje erróneo de pg_dump… pero es ciertamente muy sospechoso.
Creo que el problema real podría ser también la falta de verificaciones de integridad al enviar una gran cantidad de correos en una cola. ¿Qué pasa si un recordatorio de contraseña tiene tres meses de antigüedad? ¿Deberíamos asumir que la hora del sistema ha cambiado o que los correos no se han enviado durante un período considerable?
Nuestro nuevo servidor ahora ejecuta la versión más reciente de Discourse, pero sería una lástima que las copias de seguridad no supervisadas se queden atascadas nuevamente. https://community.learningequality.org/
Bueno, eso es extremadamente antiguo. No me sorprendería si esa versión tuviera problemas con la pausa/despause de Sidekiq que se han solucionado desde entonces.
Estoy bastante seguro de que no hay ningún error en la versión actual que pueda estar causando una copia de seguridad atascada y una cola de correo electrónico detenida.
Cierro este tema. Por favor, marca para reabrir si lo estás experimentando en la última versión de Discourse y puedes proporcionar los pasos para reproducirlo.