Tivemos um aumento de novos visitantes esta manhã devido a uma AMA popular, e muitas pessoas receberam esta mensagem, o que era compreensível, já que um tópico estava sobrecarregado e a CPU atingiu picos durante esse período. Desde então, a situação diminuiu, mas continuo recebendo esse erro informando que estou desconectado; em seguida, a página é atualizada e exibe a mensagem de aviso.
FYI, tenho 2 GB de memória e 1 CPU na DO. Havia cerca de 30 usuários online esta manhã quando o problema ocorreu pela primeira vez, e agora há apenas 10. Será que preciso apenas de mais poder de CPU ou parece um pouco estranho que isso continue acontecendo?
Tem sido intermitente; eu o vi quatro vezes hoje, mas na maior parte do tempo ele funciona bem. Eu apenas reiniciei o Docker usando service docker restart, está correto? Se continuar acontecendo, tentarei reiniciar o servidor, tentando evitar a interrupção do serviço, já que temos muitos novos usuários acessando o site. Obrigado, Jeff.
Deveria retornar automaticamente, @sam construiu esse recurso e sei que funcionou para nós no passado, conforme projetado… talvez ele tenha algumas ideias?
Mesmo que haja apenas 10 usuários online, um grande número de usuários pode estar executando tarefas em segundo plano, e um número enorme de usuários anônimos ainda pode estar acessando o site.
O site deve se recuperar automaticamente assim que a carga diminuir.
Se você realmente quiser apressar o processo, pode tentar reiniciar o contêiner.
Estou recebendo essa mensagem também. Você poderia explicar qual condição desencadeia essa mensagem no Discourse? É quando todos os workers do Unicorn estão ocupados? Algumas métricas do servidor? Obrigado.
Obrigado, @sam, isso foi muito útil. Agora entendo melhor por que um plugin (que está fazendo muitas chamadas ajax) pode estar causando os problemas que estamos vendo em nosso site. Além da mensagem de “carga extrema”, também estamos vendo telas brancas de “desaceleração” (muitas solicitações, nginx), o que também se encaixa no cenário.
Estamos agora no processo de identificar o culpado. Um problema que já encontramos foi o Babble. Nosso chat tinha mais de 10 mil posts, o que estava causando carga pesada no sistema:
Vou retornar com mais informações assim que soubermos mais.