Tráfego de rede enorme no NAS Storage

hnaseri · Outubro 5, 2022, 3:55pm

Estou hospedando todos os meus arquivos de upload em um NAS Storage (glusterfs).

Recentemente, descobri que há um tráfego de rede enorme e constante no NAS. E rastreei isso para o discourse solicitando imagens otimizadas. Existe um job que consulta constantemente essas imagens? Por quê? E como posso desativá-lo?

hnaseri · Outubro 5, 2022, 11:34pm

Aliás, a limpeza do site de uploads nas configurações está desativada no meu fórum.

sam · Outubro 6, 2022, 10:15am

Possivelmente o preenchimento que @david adicionou para a busca da cor primária da imagem.

Eventualmente, ele terminará e retornará a um estado estável.

Precisamos percorrer todas as imagens para o preenchimento, você pode conseguir contornar forçando a cor de todas as imagens para branco ou algo assim.

hnaseri · Outubro 6, 2022, 10:43am

Pelo que vejo,

github.com/discourse/discourse

app/jobs/scheduled/periodical_updates.rb

d0243f741


      
                end
          
                offset = (SiteSetting.max_new_topics).to_i
                last_new_topic = Topic.order('created_at desc').offset(offset).select(:created_at).first
                if last_new_topic
                  SiteSetting.min_new_topics_time = last_new_topic.created_at.to_i
                end
          
                Category.auto_bump_topic!
          
                Upload.backfill_dominant_colors!(25)
          
                nil
              end
          
            end
          
          end

Está funcionando em 25 imagens a cada 15 minutos. sim? isso deve ser muito insignificante. Estou vendo milhares de arquivos sendo pesquisados a cada minuto.

e também olhando a largura de banda de 6 meses atrás, vejo o mesmo comportamento. Então acho que deve ser outra coisa.

No entanto, tenho quase certeza de que está sendo feito por um job do discourse ou algo semelhante, pois quando paro o aplicativo discourse, a largura de banda desaparece. No entanto, quando apenas paro o aplicativo nginx do discourse, a largura de banda ainda permanece.

sam · Outubro 6, 2022, 12:07pm

Dê uma olhada em /sidekiq, ele deve informar quais trabalhos estão em execução, certifique-se de clicar em todas as abas

hnaseri · Outubro 6, 2022, 12:51pm

Nenhum trabalho está em execução. . Existe algum outro trabalho que não seria listado aqui?

Ou talvez haja algo no contêiner que tenta indexar arquivos?

Falco · Outubro 6, 2022, 3:03pm

Toda a nossa lógica de back-end acontece em jobs do Sidekiq. Se nenhum job estiver em execução e você ainda tiver alto I/O de disco, podem ser usuários visitando seu site e imagens sendo servidas pelo nginx?

Você tem um CDN de cache na frente dos ativos estáticos?

hnaseri · Outubro 6, 2022, 3:08pm

Eu testei isso anteriormente.

Portanto, não é porque usuários estão visitando o site. Se fosse, quando eu parasse o nginx, o tráfego deveria desaparecer.

Falco · Outubro 6, 2022, 3:09pm

Você precisará usar as ferramentas de inspeção do Linux para ver exatamente quais PIDs e syscalls estão sendo feitos então.

hnaseri · Outubro 6, 2022, 7:52pm

@Falco @sam Acho que encontrei a causa raiz.

Primeiro reiniciei o aplicativo discourse para que o tráfego constante fosse embora. Em seguida, fui ao painel de administração e acessei a seção de relatórios em massa. Faz muito tempo que os relatórios não aparecem corretamente aqui:

Imediatamente após os relatórios expirarem, vejo o salto na largura de banda da rede. E vejo este erro nos logs de erro:


'hijack admin/reports bulk ' ainda está em execução após 90 segundos no db padrão, este processo pode precisar ser reiniciado!

O que está dando errado aqui?

Falco · Outubro 6, 2022, 7:54pm

O banco de dados está no mesmo armazenamento NAS?

hnaseri · Outubro 6, 2022, 7:54pm

Não, o banco de dados está no disco SSD físico.

Apenas a pasta de upload está no NAS.

Falco · Outubro 6, 2022, 7:55pm

Portanto, não há correlação entre eles. Voltando a

hnaseri · Outubro 6, 2022, 8:00pm

Na verdade, acho que talvez haja uma correlação. No meu ambiente de teste aqui, ele calcula o espaço utilizado.

Acho que calcular o espaço utilizado em uma pasta NAS com muitos arquivos seria muito demorado e a causa raiz de alto consumo de banda.

Estou certo?

Falco · Outubro 6, 2022, 10:30pm

Executar

df -Pk

df -P

du -s

Leva uma quantidade significativa de tempo no compartilhamento de rede?

hnaseri · Outubro 6, 2022, 10:56pm

estes dois foram instantâneos

df -Pk

df -P

No entanto, du -s resultou em um comportamento semelhante ao que relatei acima.

E estava rodando por cerca de 5 minutos e não terminou, e precisei terminá-lo manualmente.

Falco · Outubro 7, 2022, 1:14am

Ah, entendi. O resultado desse relatório está em cache, mas acho que ele nunca termina e não pode ser armazenado em cache porque o seu compartilhamento de rede é muito lento.

hnaseri · Outubro 7, 2022, 4:03am

Então há algo que podemos fazer para evitar isso? Por exemplo, tratá-lo como uploads s3 que não calculamos o tamanho do disco

Tópico		Respostas	Visualizações
Huge amount of storage transactions Self-hosting	12	1733	25 de Maio de 2020
Disk usage spike during backup, Discourse crashed hard :-( Self-hosting server-resources	21	2723	23 de Julho de 2020
S3 image bandwidth costs are getting annoying Self-hosting s3 , hosting	30	4509	23 de Outubro de 2025
Discourse overloaded real traffic or DDOS? 100% CPU usage despite of decent traffic and high specs server Self-hosting server-resources	18	2507	25 de Setembro de 2021
Our disk space disappeared - how to find who/where? Self-hosting server-resources	12	2678	8 de Março de 2020

Tráfego de rede enorme no NAS Storage

Tópicos relacionados