Erro de carga extrema após atualização para 3.3.0.beta3-dev ontem (on Prem)

Atualizei para 3.3.0.beta3-dev ontem e também instalei o plugin de IA. O plugin está atualmente habilitado apenas para membros da equipe (5 pessoas)

Mas o site inteiro está muito lento, estou recebendo erros de carregamento extremos. Não consigo descobrir de onde está vindo, a carga do meu servidor parece normal.

Existe algum lugar ou lugares onde posso ir para descobrir o que está causando isso.

Aqui está o que vejo no Relatório do Rastreador, não tenho certeza se é bom ou ruim, ou o quê. Não tenho um ponto de referência.

Olhando para o meu servidor, parece que os processos do unicorn estão bastante ocupados

É esta a causa? Preciso de mais CPU? Ou apenas mais Unicórnios?

Faz tempo que não há uma atualização? Talvez ele esteja fazendo algum tipo de processamento de imagem ou reprocessamento.
Você pode dar uma olhada em /sidekiq para ver o que ele está fazendo.

Filas Estão Vazias

Não sei realmente o que o resto disso significa.

Não tenho certeza do que é normal aqui… Aqui estão as especificações do nosso servidor
image

Reiniciei tudo, estava tudo normal, mas agora estamos recebendo carga extrema novamente. Não consigo descobrir de onde vem o problema, existe alguma ferramenta que possa ajudar no Discourse?

Então os 3 unicórnios trabalhadores
image

Estão ocupados… mas não estamos tendo mais tráfego do que o normal, pelo que posso dizer, é o mesmo de sempre. A única mudança foi a atualização para 3.3.0 e a adição do plugin de IA, mas ele só está disponível para a equipe.

Os problemas começaram ontem, 03/06

Parece que temos alguns rastreadores a mais.

Aqui estão apenas os rastreadores ao longo de um mês, mas novamente, não parece muito mais alto. O site está quase inutilizável.

Qualquer ajuda seria apreciada!

Este é um palpite, mas a única coisa que se destaca para mim nos logs do Sidekiq é que o job que está sendo mostrado é NotifyMailingListSubscribers. Esse job pode potencialmente criar muitas requisições.

Além disso, você vê algum erro na sua página Admin / Logs / Error Logs?

Adicionei um bloqueio ao rastreador do Facebook porque aquele cara estava indo com tudo
image

No entanto, notei que adicionar lentidão / rastreadores não está atualizando meu robots.txt

mas o robots.txt não mostra as entradas lentas, apenas as entradas de bloqueio.

Bastantes destes

Vejo 3 erros, mas eles não parecem relacionados… (embora seja difícil dizer)

Job exception: PG::DatetimeFieldOverflow: ERROR:  timestamp out of range: \"271768-09-23 06:24:11.793040 BC\"
LINE 1: ...sers\".\"moderator\" = FALSE AND (users.created_at < '271768-09...
                                                             ^
ActionDispatch::RemoteIp::IpSpoofAttackError (IP spoofing attack?! HTTP_CLIENT_IP=\"10.10.121.119\" HTTP_X_FORWARDED_FOR=\"14.140.10.244, 14.140.10.244\")
app/controllers/topics_controller.rb:1298:in `track_visit_to_topic'
app/controllers/topics_controller.rb:169:in `show'
app/controllers/application_controller.rb:422:in `block in with_resolved_locale'
app/controllers/application_controller.rb:422:in `with_resolved_locale'
lib/middleware/omniauth_bypass_middleware.rb:64:in `call'
lib/content_security_policy/middleware.rb:12:in `call'
lib/middleware/anonymous_cache.rb:391:in `call'
lib/middleware/csp_script_nonce_injector.rb:12:in `call'
config/initializers/008-rack-cors.rb:14:in `call'
config/initializers/100-quiet_logger.rb:20:in `call'
config/initializers/100-silence_logger.rb:29:in `call'
lib/middleware/enforce_hostname.rb:24:in `call'
lib/middleware/request_tracker.rb:291:in `call'

E outra exceção de job em torno de SMTP

O Discourse faz sua própria limitação de taxa, ele não depende do robots.txt

Obrigado Michael,

Alguma outra ideia do que poderia ser? Girar mais unicórnios ajudaria?

Isso é feito a partir do app.yml?

Sim, isso provavelmente ajudaria.

env:
  UNICORN_WORKERS: 8

no app.yml fará isso.

Recomendo obter números de desempenho usando o plugin prometheus se você o tiver configurado, ou você pode usar cabeçalhos de desempenho.

Analisar seus logs da web deve ajudar muito a identificar por que seu servidor está tão ocupado; parece que os rastreadores são um bom lugar para começar.

2 curtidas

Bem, atualizei para uma nova instância do DO, dobrei a RAM e a CPU. Adicionei 8 unicórnios (vs 3), fiz uma reindexação e um vacuum do banco de dados e acho que estamos de volta aos negócios!

Obrigado pela ajuda.

3 curtidas

This topic was automatically closed 30 days after the last reply. New replies are no longer allowed.