Sem tempo limite para backups (travado desde setembro)

Gostaria de relatar os seguintes problemas:

  1. Parece não haver tempo limite para backups. Assim, um backup automático ficou travado desde setembro.
  2. Uma vez cancelado, todos os nossos usuários receberam resumos por e-mail e redefinições de senha agregadas desde setembro.

Aqui está o log:

[2019-09-26 03:35:25] pg_dump: criando ÍNDICE "public.idx_tag_users_ix1"
[2019-09-26 03:35:25] pg_dump: criando ÍNDICE "public.idx_tag_users_ix2"
[2019-09-26 03:35:25] pg_dump: criando ÍNDICE "public.idx_topic_id_public_type_deleted_at"
[2019-09-26 03:35:25] pg_dump: criando ÍNDICE "public.idx_topics_front_page"
[2019-09-26 03:35:25] pg_dump: criando ÍNDICE "public.idx_topics_user_id_deleted_at"
[2019-09-26 03:35:25] pg_dump: criando ÍNDICE "public.idx_unique_actions"
[2019-09-26 03:35:25] pg_dump: criando ÍNDICE "public.idx_unique_flags"
[2019-09-26 03:35:25] Finalizando backup...
[2019-09-26 03:35:25] Criando arquivo: our-community-2019-09-26-033520-v20171214040346.tar.gz
[2019-09-26 03:35:25] Verificando se o arquivo já existe...
[2019-09-26 03:35:25] pg_dump: criando ÍNDICE "public.idx_unique_post_uploads"
[2020-01-24 16:02:39] Processo de backup foi cancelado!
[2020-01-24 16:02:39] Notificando 'system' sobre o fim do backup...
4 curtidas

Embora isso não seja ótimo, você tem alguma ideia do motivo pelo qual seu backup demorou tanto? Seu banco de dados é enorme?

1 curtida

Não, é pequeno. Os arquivos .dump do Postgres tinham 112 MB.

Como seu servidor foi instalado? Onde ele está implantado?

1 curtida

Isso é muito estranho. Há uma mensagem de log solta do “pg_dump” após a mensagem “Finalizando backup…”.

Além disso, não sei por que o sistema parou de enviar e-mails. O Sidekiq já deveria estar despausado quando “Finalizando backup…” aparece nos logs.

Qual versão do Discourse você está usando? Suponho que você não tenha executado nenhuma atualização desde setembro, caso contrário, tenho certeza de que isso teria interrompido o backup. :thinking:

8 curtidas

Obrigado por ler e responder! Percebi o problema ao inspecionar um servidor antigo, que já foi substituído. Ainda tenho acesso à instância antiga.

  • Ocorreu na versão 1.8
  • Os únicos e-mails enviados foram os de new_version. Não houve redefinições de senha nem notificações.
  • Os logs são frequentemente escritos e flushados em threads/processos diferentes, então não tenho certeza se isso pode explicar a mensagem estranha do pg_dump… mas é certamente muito suspeito.

Acho que o problema real talvez seja também a falta de verificações de sanidade ao enviar uma pilha de e-mails em uma fila. E se um lembrete de senha tiver 3 meses de idade? Devemos assumir que o horário do sistema mudou ou, de fato, que os e-mails não foram enviados por um período considerável?

Nosso novo servidor agora está executando a versão mais recente do Discourse, mas seria uma pena se os backups não monitorados voltassem a ficar travados. https://community.learningequality.org/

1 curtida

Bem, isso é extremamente antigo. Não me surpreenderia se aquela versão tivesse problemas com pausar/despause do Sidekiq que já foram corrigidos desde então.

Não há atualizações automáticas no Discourse.

4 curtidas

Não há atualizações desatendidas no Discourse.

Isso foi um erro de digitação.

Tenho quase certeza de que não há nenhum bug na versão atual que possa estar causando um backup travado e uma fila de e-mails parada.

Vou fechar este tópico. Por favor, marque para reabrir se você estiver enfrentando isso na versão mais recente do Discourse e puder fornecer os passos para reproduzir o problema.

4 curtidas