某些链接被误解

Some links generated by Amazon are not correctly interpreted. Here is an exemple:
https://www.amazon.fr/Partition-intérieure-jazz-musiques-improvisées/dp/2907891030?_mk_fr_FR=%C3%85M%C3%85%C5%BD%C3%95%C3%91&dchild=1&keywords=partition+int%C3%A9rieure&qid=1625013895&sr=8-1&linkCode=ll1&tag=theoriemusicale-21&linkId=87d44c3dedd4b919e02195911a7a2b0d&language=fr_FR&ref=as_li_ss_tl

Here is a screen capture:

Here is the link:
https://www.amazon.fr/Partition-int%C3%A9rieure-jazz-musiques-improvis%C3%A9es/dp/2907891030?__mk_fr_FR=%C3%85M%C3%85%C5%BD%C3%95%C3%91&dchild=1&keywords=partition+int%C3%A9rieure&qid=1625013895&sr=8-1&linkCode=ll1&tag=theoriemusicale-21&linkId=87d44c3dedd4b919e02195911a7a2b0d&language=fr_FR&ref_=as_li_ss_tl

The problem seems to come from the double underscore

PS: Great book by the way :slight_smile:

@Vitaly is this something we should report on the markdown.it repo?

2 个赞

这仍然是已知问题,https://github.com/markdown-it/markdown-it/issues/38,可以通过 \u003clink\u003e(链接周围的尖括号)来解决。没有新的进展可以报告。

仍然没有截止日期。好消息是:我终于在生产环境中推出了我的新论坛软件 https://rcopen.com/(这就是为什么花费了大量资源来创建 markdown-it)。所以,修复这个错误的几率从“遥远的无限”变成了“未来的某个时候” :slight_smile:

3 个赞

@sam,需要帮助。我需要信息,现实世界中的链接是否可以以 _~-+ 结尾。

http://example.com/?sdf,wer- 等等。

markdown-it 的链接器重写之前,了解这一点很重要。你能 grep 一些巨大的帖子数据库来查找这种情况,并告诉我是否找到任何东西?可能,这些链接被发布为 <...> 作为一种变通方法。所以,用于数据库扫描的正则表达式模式将是 /\u003chttp.+[+~_-]\u003e/g(未经测试)。

我无法访问如此大量的 markdown 文本来达到可接受的置信度。也许你能帮忙,或者认识可以帮忙的人?

我们无法访问客户数据,但在元数据中:

-:中等稀有(181)
_:稀有(58)
+:非常稀有(8)
~:几乎从不(2)

还有一个语料库供您查询:https://data.stackexchange.com/,这或许能帮助您获取更多数据(您可以查询 Stack 站点)。

1 个赞

有意思。你能把元数据库里的所有链接都发私信给我吗?我需要直观地看一下。

或者,如果可能的话——提供那些链接被找到的帖子的链接。

感谢提供信息。我会看看的。

我相信这最近正在跟踪:

我将关闭此问题,以支持那个。 :+1: