リンクの一部が誤って解釈されています

Some links generated by Amazon are not correctly interpreted. Here is an exemple:
https://www.amazon.fr/Partition-intérieure-jazz-musiques-improvisées/dp/2907891030?_mk_fr_FR=%C3%85M%C3%85%C5%BD%C3%95%C3%91&dchild=1&keywords=partition+int%C3%A9rieure&qid=1625013895&sr=8-1&linkCode=ll1&tag=theoriemusicale-21&linkId=87d44c3dedd4b919e02195911a7a2b0d&language=fr_FR&ref=as_li_ss_tl

Here is a screen capture:

Here is the link:
https://www.amazon.fr/Partition-int%C3%A9rieure-jazz-musiques-improvis%C3%A9es/dp/2907891030?__mk_fr_FR=%C3%85M%C3%85%C5%BD%C3%95%C3%91&dchild=1&keywords=partition+int%C3%A9rieure&qid=1625013895&sr=8-1&linkCode=ll1&tag=theoriemusicale-21&linkId=87d44c3dedd4b919e02195911a7a2b0d&language=fr_FR&ref_=as_li_ss_tl

The problem seems to come from the double underscore

PS: Great book by the way :slight_smile:

@Vitaly is this something we should report on the markdown.it repo?

「いいね!」 2

それはまだ既知の問題です。https://github.com/markdown-it/markdown-it/issues/38。`\u003clink\u003e`(リンクの周りの山括弧)で回避されています。報告する新しいことはありません。

まだ締め切りはありません。良いニュースは、新しいフォーラムソフトウェア https://rcopen.com/ をついに本番環境に展開したことです(なぜ markdown-it を作成するために多くのリソースが費やされたのか)。したがって、このバグを修正する可能性は「遠い無限」から「いつか」に変わりました:)

「いいね!」 3

@sam、助けが必要です。リンクが _~-、または + で終わることはありますか?

http://example.com/?sdf,wer- のようなものです。

これは markdown-it のリンクファニファイヤのリライト前に知っておくべき重要なことです。巨大な投稿データベースでそのようなケースをgrepして、何か見つかったか見つからなかったか教えていただけますか?おそらく、これらのリンクは回避策として <...> として投稿されたのでしょう。そのため、データベーススキャン用の正規表現パターンは /\u003chttp.+[+~_-]\u003e/g のようなものになるでしょう(テストしていません)。

十分な信頼性を得るために、そのような大量のマークダウンテキストにアクセスできません。もしかしたら、あなたか、手伝える人を知っているかもしれませんか?

顧客データにはアクセスできませんが、メタデータでは以下のようになっています。

-:まれ(181)
_:まれ(58)
+:非常にまれ(8)
~:ほとんどない(2)

さらにデータを取得するのに役立つ可能性のあるコーパスはこちらです:https://data.stackexchange.com/ (Stackサイトをクエリできます)

「いいね!」 1

興味深いですね。メタデータベースのリンクをすべてPMで送ってもらえますか?視覚的に確認したいです。

もし可能であれば、それらのリンクが見つかった投稿へのリンクもお願いします。

情報ありがとうございます。見てみます。

こちらで最新の情報が追跡されていると思われます。

こちらに統合してクローズします。:+1: