Olá a todos.
Espero que alguém possa me ajudar a resolver um problema que estamos enfrentando atualmente em nosso fórum :-
https://forum.combustionpunks.co.uk
Essa é uma história longa… mas quero fornecer todas as informações que possam ajudar a resolver o problema, então peço paciência. Ao longo disso, vocês notarão que não tenho muita experiência com Ubuntu ![]()
Tudo estava funcionando perfeitamente há bastante tempo
até ontem à noite.
Estamos passando por uma pequena rebranding, atualizando logotipos e coisas do tipo, então ontem eu estava no painel administrativo fazendo upload dos novos logotipos. Também notei que estávamos algumas versões atrás, então executei as atualizações, tendo que fazê-las manualmente seguindo as instruções aqui:-
por exemplo:
cd /var/discourse
git pull
./launcher rebuild app
Parecia que tudo estava indo bem, as atualizações foram concluídas, os logotipos foram carregados e exibidos, testei alguns temas, voltei ao original e depois saí para uma atividade de engajamento social relacionada ao fórum… sim, fui a um pub para jantar com meus amigos.
Cerca de 30 minutos depois, enquanto estava fora, notamos que o fórum estava offline… um pequeno susto, mas então percebemos que a Digital Ocean estava com problemas, então fiquei mais tranquilo.
Voltei cerca de 2 horas depois, os problemas da DO foram resolvidos, mas o fórum ainda estava offline… sem problemas, reiniciei o droplet e tudo voltou a funcionar… cerca de 30 minutos depois, estava offline novamente…
Em seguida, pensei que seria melhor limpar qualquer outra atualização pendente, então tentei atualizar o Docker com:
wget -qO- https://get.docker.com/ | sh
Isso não pareceu fazer muita coisa.
Reconstruí o aplicativo ./launcher rebuild app
Não acredito que tenha sido atualizado, pois ao reconstruir o aplicativo, está dizendo:
docker version 17.05.0-ce depreciated e, ao executar docker version, está relatando 17.05.0-ce
Então notei que, pouco antes do fórum ficar offline, estávamos recebendo mensagens como:
Out of memory: kill process (convert) or sacrifice child
Out of memory: kill process (ruby) or sacrifice child
Executei o Htop
Muitas instâncias do sidekiq, encontrei uma postagem sobre reduzir a quantidade de threads recriadas de uma vez - reduzi de 80 para 2 - os problemas continuaram
Instâncias do convert rodando contra JPEGs em var/www/discourse/public/uploads/default/original/ (não sei como exibir o restante da string para ver contra quais imagens elas estão rodando)
Uso da CPU em 100% - Ruby var/www/discourse/vendor/bundle/ruby/2.6.0/bin/unicorn -E
Atualizei o sistema operacional - agora estou executando Ubuntu 18.04
Docker ainda na versão 17.05.0-ce.
Redimensionei o droplet de 2GB 1vCPU 50GB ($10) para 3GB 1vCPU 50GB ($15)
Os problemas continuam.
Reiniciar o droplet ou reconstruir o Discourse faz com que ele volte a funcionar por um curto período (10 a 30 minutos) antes de ficar offline novamente.
Qualquer ajuda com isso seria muito apreciada, muitos agradecimentos antecipadamente
Matt