sam
(Sam Saffron)
2
@Vitaly、これは markdown.it リポジトリで報告すべき事項でしょうか?
「いいね!」 2
Vitaly
3
それはまだ既知の問題です。https://github.com/markdown-it/markdown-it/issues/38。`\u003clink\u003e`(リンクの周りの山括弧)で回避されています。報告する新しいことはありません。
まだ締め切りはありません。良いニュースは、新しいフォーラムソフトウェア https://rcopen.com/ をついに本番環境に展開したことです(なぜ markdown-it を作成するために多くのリソースが費やされたのか)。したがって、このバグを修正する可能性は「遠い無限」から「いつか」に変わりました:)
「いいね!」 3
Vitaly
4
@sam、助けが必要です。リンクが _、~、-、または + で終わることはありますか?
http://example.com/?sdf,wer- のようなものです。
これは markdown-it のリンクファニファイヤのリライト前に知っておくべき重要なことです。巨大な投稿データベースでそのようなケースをgrepして、何か見つかったか見つからなかったか教えていただけますか?おそらく、これらのリンクは回避策として <...> として投稿されたのでしょう。そのため、データベーススキャン用の正規表現パターンは /\u003chttp.+[+~_-]\u003e/g のようなものになるでしょう(テストしていません)。
十分な信頼性を得るために、そのような大量のマークダウンテキストにアクセスできません。もしかしたら、あなたか、手伝える人を知っているかもしれませんか?
sam
(Sam Saffron)
5
顧客データにはアクセスできませんが、メタデータでは以下のようになっています。
-:まれ(181)
_:まれ(58)
+:非常にまれ(8)
~:ほとんどない(2)
さらにデータを取得するのに役立つ可能性のあるコーパスはこちらです:https://data.stackexchange.com/ (Stackサイトをクエリできます)
「いいね!」 1
Vitaly
6
興味深いですね。メタデータベースのリンクをすべてPMで送ってもらえますか?視覚的に確認したいです。
もし可能であれば、それらのリンクが見つかった投稿へのリンクもお願いします。
情報ありがとうございます。見てみます。