Some links generated by Amazon are not correctly interpreted. Here is an exemple: https://www.amazon.fr/Partition-intérieure-jazz-musiques-improvisées/dp/2907891030?_mk_fr_FR=%C3%85M%C3%85%C5%BD%C3%95%C3%91&dchild=1&keywords=partition+int%C3%A9rieure&qid=1625013895&sr=8-1&linkCode=ll1&tag=theoriemusicale-21&linkId=87d44c3dedd4b919e02195911a7a2b0d&language=fr_FR&ref=as_li_ss_tl
Here is the link: https://www.amazon.fr/Partition-int%C3%A9rieure-jazz-musiques-improvis%C3%A9es/dp/2907891030?__mk_fr_FR=%C3%85M%C3%85%C5%BD%C3%95%C3%91&dchild=1&keywords=partition+int%C3%A9rieure&qid=1625013895&sr=8-1&linkCode=ll1&tag=theoriemusicale-21&linkId=87d44c3dedd4b919e02195911a7a2b0d&language=fr_FR&ref_=as_li_ss_tl
The problem seems to come from the double underscore
Ainda sem prazos. A boa notícia é que finalmente lancei meu novo software de fórum em produção https://rcopen.com/ (por que muitos recursos foram gastos para criar markdown-it). Assim, as chances de corrigir este bug mudaram de “infinito distante” para “algum futuro”
@sam, ajuda necessária. Preciso de informações, os links do mundo real podem terminar com _, ~, - ou +.
http://example.com/?sdf,wer- e assim por diante.
Isso é importante saber antes da reescrita do linkificador do markdown-it. Você poderia pesquisar em bancos de dados de postagens enormes por esses casos e me informar se algo foi encontrado ou não? Provavelmente, esses links foram postados como \u003c...\u003e como uma solução alternativa. Portanto, o padrão regexp para a varredura do banco de dados seria algo como /\u003chttp.+[+~_-]\u003e/g (não testado)
Não tenho acesso a um volume tão grande de textos em markdown para atingir uma confiança aceitável. Talvez você possa ajudar, ou conhecer alguém que possa ajudar?
-: mal passado (181) _: raro (58) +: muito raro (8) ~: quase nunca (2)
Há também este corpus que você pode consultar: https://data.stackexchange.com/ que pode ajudá-lo a obter mais dados (você pode consultar os sites do Stack).