Topic_link 表在使用 s3 时包含错误的 url

你好。我遇到了一个问题:对于托管在 S3 + CDN 上的上传文件,外部链接点击未被计入。请查看以下主题以了解问题详情:

https://talks.dos.zone/t/collections/44653

打开“赛车”(Racing)分类,你会看到类似以下内容:

“试驾”(Test Drive)从未记录过对其的点击。这是因为 topic_link 表中没有相关记录。该页面上的所有链接都使用相同的模式:https://dos.zone/rep/my/<文件编码后的 URL>

所有正常工作的链接都是手动上传的文件。但是,未被计入的链接是通过 Discourse 上传的。例如:
https://doszone-uploads.s3.dualstack.eu-central-1.amazonaws.com/custom/dos/death-rally.jsdos - 已计入,
https://doszone-uploads.s3.dualstack.eu-central-1.amazonaws.com/original/2X/a/abcf902327ce1cf6fe7b3e8c809d638984377d7c.jsdos - 未计入。

我已导出该主题的 topic_linktopic_link.csv|附件(6.9 KB)。

如果你查看该文件,会发现所有未被计入的链接都被存储为 https://cdn.dos.zone/<文件路径>,而不是正确的 https://dos.zone/rep/my/<文件 URL>。而被计入的链接则存储正确。

我尝试查找原因但毫无进展,topic_link.rb/extract_from 似乎对 CDN 链接没有任何处理::thinking:

1 个赞

这看起来是我们需要清理的问题。可能是我们的 CDN 替换发生在提取之后。

@vinothkannans 你能调查一下,看看是否也能在这里复现吗?

4 个赞

我目前还无法复现此问题。不过,它仍在我的待办列表中::memo:

1 个赞

有什么我可以帮您的吗?

1 个赞