Mais detalhes sobre como o cache do Redis é utilizado?

griegm · Setembro 15, 2021, 8:05pm

Olá!

Estou realizando alguns testes de carga em uma instância do Discourse e notei que, ao buscar repetidamente o mesmo tópico de comentários, a taxa de acertos no cache do Redis caiu, em vez de subir — o que foi um pouco inesperado (para uma mistura de leituras/escritas, vimos uma taxa de acertos de até 85%; para 100% de leituras, a taxa caiu para tão baixo quanto 22%).

Fiz algumas buscas no código e nos fóruns aqui, e ainda não está muito claro para mim como exatamente o cache do Redis é utilizado. O README afirma o seguinte:

Usamos o Redis como cache e para dados transitórios.

Usei o redis-cli para listar os comandos enviados ao cache do Redis durante o teste de carga mencionado acima, e vi principalmente comandos “get” para jobs agendados e para chaves com o prefixo “__mb_backlog_id_n_” (acredito que isso se refira a funcionalidades do MessageBus).

Tenho as seguintes perguntas:

Existe uma maneira “fácil” de pesquisar no código quais partes dos dados estão sendo armazenadas em cache no Redis? Adoraria conseguir responder a essas perguntas sozinho, mas, infelizmente, não sou muito familiarizado com aplicações Ruby on Rails (ou com Ruby em geral, na verdade).
O fato de estar logado ou deslogado impacta as taxas de acerto no cache? Como referência, o teste de carga mencionado acima usava uma chave de API de administrador.
Dados frequentemente consultados ou relativamente estáticos, como o conteúdo das publicações, são armazenados em cache no Redis? Ou o Redis é usado principalmente para agendamento de jobs e processamento em segundo plano com Sidekiq e afins?

Obrigado desde já!

Falco · Setembro 15, 2021, 11:28pm

Esta é a questão principal aqui. O cache mais agressivo ocorre para solicitações anônimas, então sugiro refazer o teste de carga com alguns robôs anônimos.

Existem alguns métodos que podem ser pesquisados com grep, como Discourse.cache.fetch e DistributedCache.new.

Armazenamos em cache alguns blobs de configuração pouco frequentes, mas a abordagem para tópicos consiste principalmente em armazenar em cache toda a resposta para usuários anônimos, permitindo que o aplicativo construa uma resposta com pouco ou nenhum acesso ao banco de dados.

O Redis é amplamente utilizado pelo Sidekiq e pelo MessageBus.

griegm · Setembro 16, 2021, 5:15am

Sensacional, obrigado pela resposta super útil!

griegm · Setembro 17, 2021, 9:49pm

Acabei de executar novamente o teste de carga, mas desta vez com solicitações anônimas, e vimos uma enorme melhoria no desempenho! Anteriormente, éramos capazes de atingir cerca de 25 solicitações por segundo em um único host; agora, conseguimos atingir 380! A taxa de acertos do cache Redis também aumentou de ~22% para ~66%.

Apenas pensei em retornar com os resultados caso alguém estivesse curioso.

Obrigado novamente pela ajuda!

Tópico		Respostas	Visualizações
What type of details does redis store? Self-hosting	2	443	21 de Março de 2023
What does Discourse use Redis for? Development	5	3433	18 de Agosto de 2022
Using Redis then dump data is just great Development	4	1041	12 de Abril de 2016
How Discourse handle high HTTP request? Development	2	591	12 de Março de 2019
Huge increase in Redis use after changing hosts Self-hosting	9	1388	14 de Março de 2021

Mais detalhes sobre como o cache do Redis é utilizado?

Tópicos relacionados