Atualização em tempo real de tópicos trava sob alta atividade

ljpp · Janeiro 12, 2021, 7:35pm

Os jogos têm sido escassos (graças à COVID), então tivemos muito poucas oportunidades de medir e fazer ajustes nisso.

Descobrimos que, mesmo com nossos recursos de hardware aprimorados (6+4 vCores e 16+8 GB de RAM), até uma plateia moderadamente ativa consegue gerar 429 erros de congelamento no cliente. Vimos isso nos jogos da U20 WC, que atraíram cerca de ~50% do nosso público habitual de jogos para os chats.

Após medições, testes e erros, chegamos às seguintes configurações:

  DISCOURSE_REJECT_MESSAGE_BUS_QUEUE_SECONDS: 0.4
  DISCOURSE_MAX_REQS_PER_IP_PER_MINUTE: 400
  DISCOURSE_MAX_REQS_PER_IP_PER_10_SECONDS: 100

Isso parece eliminar 80% dos erros 429, permitindo uma experiência relativamente suave para a maioria dos usuários.

O próximo passo teria sido adquirir recursos de hardware diferentes, seja usando servidores dedicados para velocidade de thread única ou migrando para um provedor de VPS que ofereça planos com gazzillion vCores. No entanto, para nós, o próximo passo é trabalhar com a equipe de hospedagem do Discourse, como @sam sugeriu anteriormente.

Esperamos que esses ajustes sejam úteis para @iceman, @alec ou qualquer outra pessoa. Fique atento ao uso da CPU e às filas. Além disso, o que aprendi com essa experiência é que 2 containers são muito melhores do que um — os ajustes podem ser aplicados com tempo de inatividade quase nulo e os recursos de hardware podem ser explorados de forma mais granular.

Ainda estou interessado em quaisquer novos ajustes ou descobertas que possam ajudar a melhorar o desempenho e a experiência do usuário em discussões dinâmicas impulsionadas por eventos do mundo real.

Tópico		Respostas	Visualizações
Improving Instance Performance (Megatopics, Database Size and Extreme Load) Self-hosting	60	5745	13 de Outubro de 2020
Extreme load error Self-hosting	19	1751	13 de Agosto de 2023
Topic history not loading correctly after migration Support	20	1103	8 de Fevereiro de 2023
Discourse installation has been getting slower and slower and slower Self-hosting server-resources	36	1866	15 de Abril de 2023
The MEGATOPIC: public good, or public menace? Community Building	41	16489	4 de Abril de 2021

Atualização em tempo real de tópicos trava sob alta atividade

Tópicos relacionados