Tabela Topic_link contém URLs erradas ao usar s3

Olá. Enfrentei um problema em que cliques em links externos não são contabilizados para URLs que contêm arquivos carregados hospedados no S3 + CDN. Veja este tópico para entender o problema:

https://talks.dos.zone/t/collections/44653

Abra a categoria “Racing” e você verá algo assim:

O Test Drive nunca registra um clique nele. Isso ocorre porque a tabela topic_link não contém um registro para ele. Todos os links nesta página usam o mesmo padrão: https://dos.zone/rep/my/<url-codificada-do-arquivo>.

Todos os links que funcionam corretamente estão em arquivos carregados manualmente. Porém, os links que não são contabilizados foram carregados via Discourse. Por exemplo:
https://doszone-uploads.s3.dualstack.eu-central-1.amazonaws.com/custom/dos/death-rally.jsdos - CONTABILIZADO,
https://doszone-uploads.s3.dualstack.eu-central-1.amazonaws.com/original/2X/a/abcf902327ce1cf6fe7b3e8c809d638984377d7c.jsdos - NÃO CONTABILIZADO.

Fiz um dump da tabela topic_link para este tópico topic_link.csv (6,9 KB).

Se você olhar, verá que todos os links não contabilizados estão armazenados como https://cdn.dos.zone/<caminho-para-o-arquivo> em vez do correto https://dos.zone/rep/my/<url-do-arquivo>. Os links contabilizados estão armazenados corretamente.

Tentei descobrir por que isso acontece, mas sem sucesso; topic_link.rb/extract_from não faz nada com o CDN :thinking:

1 curtida

Isso parece algo que devemos limpar. Provavelmente a substituição do nosso CDN ocorre após a extração.

@vinothkannans, você pode investigar e ver se consegue reproduzir isso aqui também?

4 curtidas

Ainda não consegui reproduzir esse problema. De qualquer forma, ele continua na minha lista :memo:

1 curtida

Posso te ajudar de alguma forma?

1 curtida