Некоторые ссылки интерпретируются неверно

Некоторые ссылки, сгенерированные Amazon, интерпретируются неправильно. Вот пример:

Вот скриншот:

Вот ссылка:
https://www.amazon.fr/Partition-int%C3%A9rieure-jazz-musiques-improvis%C3%A9es/dp/2907891030?__mk_fr_FR=%C3%85M%C3%85%C5%BD%C3%95%C3%91&dchild=1&keywords=partition+int%C3%A9rieure&qid=1625013895&sr=8-1&linkCode=ll1&tag=theoriemusicale-21&linkId=87d44c3dedd4b919e02195911a7a2b0d&language=fr_FR&ref_=as_li_ss_tl

Похоже, проблема возникает из-за двойного подчеркивания.

P.S. Кстати, отличная книга :slight_smile:

@Vitaly, стоит ли нам сообщить об этом в репозиторий markdown.it?

2 лайка

Это всё ещё известная проблема: linkify doesn't accept urls with underscores · Issue #38 · markdown-it/markdown-it · GitHub. Обходное решение — использовать <ссылка> (ссылка в угловых скобках). Ничего нового сообщить не могу.

Дедлайны всё ещё не установлены. Хорошая новость: я наконец-то выкатил в продакшн своё новое программное обеспечение для форумов https://rcopen.com/ (именно поэтому было потрачено так много ресурсов на создание markdown-it). Так что шансы на исправление этой ошибки изменились с «очень далёкого будущего» на «какое-то будущее» :slight_smile:

3 лайка

@sam, нужна помощь. Мне нужна информация: могут ли ссылки из реального мира заканчиваться на _, ~, - или +.

Например: http://example.com/?sdf,wer- и так далее.

Это важно знать перед переписыванием линкификатора в markdown-it. Не могли бы вы поискать в огромных базах данных постов такие случаи и сообщить, найдено ли что-то или нет? Возможно, такие ссылки публиковались как <...> в качестве обходного пути. Тогда регулярное выражение для сканирования БД будет выглядеть примерно так: /<http.+[+~_-]>/g (не тестировалось).

У меня нет доступа к такому объёму текстов в Markdown, чтобы достичь приемлемой уверенности. Может быть, вы сможете помочь или знаете кого-то, кто мог бы помочь?

У нас нет доступа к данным клиентов, но по метаданным:

-: встречается редко (181)
_: встречается очень редко (58)
+: встречается крайне редко (8)
~: практически никогда (2)

Также существует этот корпус, который можно запрашивать: https://data.stackexchange.com/, что может помочь вам получить больше данных (вы можете делать запросы к сайтам Stack).

1 лайк

Интересно. Не могли бы вы отправить мне в личные сообщения все эти ссылки из базы данных Meta? Мне нужно увидеть их визуально.

ИЛИ, если возможно, — ссылки на сообщения, в которых были найдены эти ссылки.

Спасибо за информацию. Обязательно посмотрю.

Полагаю, что это в настоящее время отслеживается здесь:

Я закрою эту тему в пользу указанной выше. :+1: