Amazon 生成的一些链接未能被正确解析。示例如下:
https://www.amazon.fr/Partition-intérieure-jazz-musiques-improvisées/dp/2907891030?__mk_fr_FR=ÅMÅŽÕÑ\u0026dchild=1\u0026keywords=partition+intérieure\u0026qid=1625013895\u0026sr=8-1\u0026linkCode=ll1\u0026tag=theoriemusicale-21\u0026linkId=87d44c3dedd4b919e02195911a7a2b0d\u0026language=fr_FR\u0026ref_=as_li_ss_tl
以下是屏幕截图:
以下是 链接:
https://www.amazon.fr/Partition-int%C3%A9rieure-jazz-musiques-improvis%C3%A9es/dp/2907891030?__mk_fr_FR=%C3%85M%C3%85%C5%BD%C3%95%C3%91\u0026dchild=1\u0026keywords=partition+int%C3%A9rieure\u0026qid=1625013895\u0026sr=8-1\u0026linkCode=ll1\u0026tag=theoriemusicale-21\u0026linkId=87d44c3dedd4b919e02195911a7a2b0d\u0026language=fr_FR\u0026ref_=as_li_ss_tl
问题似乎出在双下划线上。
附注:顺便说一句,这本书很棒 
sam
(Sam Saffron)
2
@Vitaly 这件事我们应该在 markdown.it 仓库中上报吗?
2 个赞
这仍然是已知问题,https://github.com/markdown-it/markdown-it/issues/38,可以通过 \u003clink\u003e(链接周围的尖括号)来解决。没有新的进展可以报告。
仍然没有截止日期。好消息是:我终于在生产环境中推出了我的新论坛软件 https://rcopen.com/(这就是为什么花费了大量资源来创建 markdown-it)。所以,修复这个错误的几率从“遥远的无限”变成了“未来的某个时候” 
3 个赞
@sam,需要帮助。我需要信息,现实世界中的链接是否可以以 _、~、- 或 + 结尾。
http://example.com/?sdf,wer- 等等。
在 markdown-it 的链接器重写之前,了解这一点很重要。你能 grep 一些巨大的帖子数据库来查找这种情况,并告诉我是否找到任何东西?可能,这些链接被发布为 <...> 作为一种变通方法。所以,用于数据库扫描的正则表达式模式将是 /\u003chttp.+[+~_-]\u003e/g(未经测试)。
我无法访问如此大量的 markdown 文本来达到可接受的置信度。也许你能帮忙,或者认识可以帮忙的人?
sam
(Sam Saffron)
5
我们无法访问客户数据,但在元数据中:
-:中等稀有(181)
_:稀有(58)
+:非常稀有(8)
~:几乎从不(2)
还有一个语料库供您查询:https://data.stackexchange.com/,这或许能帮助您获取更多数据(您可以查询 Stack 站点)。
1 个赞
有意思。你能把元数据库里的所有链接都发私信给我吗?我需要直观地看一下。
或者,如果可能的话——提供那些链接被找到的帖子的链接。
感谢提供信息。我会看看的。