Почему Markdown делает это? (удаление пробелов и другие функции)

Rhababo · 18.Сентябрь.2023 20:34:06

Приношу извинения за расплывчатый заголовок.

Я в процессе модификации некоторых функций Markdown в Discourse, чтобы они лучше соответствовали потребностям моего сообщества, которое переходит с форума MyBB.

Discourse — это мой первый опыт работы с Markdown, и я хочу придерживаться принципа: «Не сноси забор, если не знаешь, зачем он там стоит». Однако мне трудно понять, почему Markdown выполняет те или иные действия, и я был бы очень признателен за ресурсы, которые помогут мне разобраться (особенно если есть какие-то вопросы безопасности, которые я могу упускать).

Ответ в этой теме предоставил несколько хороших общих ссылок, включая ранние обсуждения и (теперь уже не существующий) плагин:

А этот пост оказался невероятно полезным с точки зрения разработки:

Но, повторюсь, я хочу понять, почему существуют определённые функции, чтобы я мог лучше оценить необходимость их удаления или настройки.

Вот функции, которые сейчас находятся в фокусе моего внимания:

Удаление последовательных переносов строк без тега <br> или другого кода.
Автоматическое создание блоков кода на строках с 4 и более ведущими пробелами.
Удаление ведущих пробелов на новой строке.
Превращение любой последовательности чисел в нумерованный список с последовательным увеличением.

Любая помощь будет очень кстати! Спасибо!

Canapin · 18.Сентябрь.2023 21:49:59

Меня очень интересует эта тема, но у меня нет знаний, чтобы ответить на большинство ваших вопросов.

Однако,

По-моему, Discourse стремится делать посты чистыми и удобными для чтения.
Убирая лишние переносы строк и обрезая пробелы в начале строк, система обеспечивает единообразие внешнего вида постов.
Это особенно помогает, когда пользователи, иногда даже не осознавая этого (я знаю таких!), добавляют случайные пробелы или пустые строки, что может затруднить чтение их контента.

Это может показаться странным, особенно если вы намеренно хотите сделать разрыв в списке, но, вероятно, это сделано для того, чтобы нумерованные списки оставались максимально простыми, без необходимости перенумеровывать каждый элемент при добавлении нового в пост (или в пост-вики).

Jagster · 19.Сентябрь.2023 06:09:36

На самом деле, чрезмерная плотность размещения элементов может затруднить чтение. Например, абзац сразу после изображения.

Но… я использую <br />, так что это не проблема.

Однако ещё один нюанс… Я почти уверен, что операция очистки не имеет никакого отношения к улучшению читаемости. Это особенность самого кода. Похоже на утомлённое утверждение, что Markdown легче читать на «уровне кода». Конечный пользователь никогда не оказывается в такой ситуации.

Что ж. Сейчас это чистая мета-дискуссия.

Но я отказываюсь верить, что удаление пустых строк и лишних пробелов действительно улучшает общий опыт для конечного пользователя.

simon · 19.Сентябрь.2023 16:07:12

Не уверен, поможет ли это решить вашу проблему, но в Discourse есть настройка сайта «традиционные разрывы строк в Markdown», которая по умолчанию отключена. При её включении для создания разрыва строки требуются два пробела в конце.

Вот пример с включённой настройкой:

А вот пример с отключённой настройкой (значение по умолчанию):

Возможно, стоит заглянуть на эту страницу и попробовать её 10-минутный учебник по Markdown: Markdown Reference. Учебник для новых пользователей в Discourse содержит ссылку на эту страницу, но многие пользователи, проходящие учебник, вероятно, её пропускают:

Heliosurge · 20.Сентябрь.2023 01:33:20

Это точно превращает ASCII-арт в вызов для правильного отображения.

Rhababo · 20.Сентябрь.2023 03:12:31

Я очень ценю ваши разъяснения. В моём сообществе есть крупное подсообщество, посвящённое форумным играм и рассказыванию историй, где свобода в форматировании часто важнее единообразия. Если основная цель этих функций действительно заключается в поддержании последовательного и упрощённого вида, то, вероятно, для моего случая их можно отключить или, как минимум, предоставить пользователям возможность выбора через переключатель.

Это очень полезный учебник, и его акцент на «создании красивого текста» действительно согласуется с ранее упомянутыми идеями о единообразии. Спасибо, что указали на него.

Rhababo · 20.Сентябрь.2023 19:16:48

Читая дополнительную информацию о Markdown, я обнаружил этот сайт, который оказался особенно познавательным.

Я считаю, что это оригинальное описание Markdown, на которое ссылается команда CommonMark, и оно показывает, что одна из ключевых причин того, как работает Markdown, заключается в его близости к HTML.

Например, первое предложение там гласит:

Markdown — это инструмент преобразования текста в HTML для веб-авторов.

Мне кажется, что некоторые странности Markdown обусловлены не столько его организационными свойствами, сколько стремлением аккуратно преобразовывать текст в соответствующий HTML-код.

Это объясняет, почему пробельные символы обрезаются: ведь HTML сам обрезает пробелы.

Также становится понятнее, почему любая последовательность чисел превращается в нумерованный список с возрастающими номерами, если обратиться к этому разделу:

https://daringfireball.net/projects/markdown/syntax#list:

Важно отметить, что фактические числа, которые вы используете для маркировки списка, не влияют на HTML-вывод, генерируемый Markdown. HTML-код, который Markdown создаёт из приведённого выше списка, выглядит так:
<ol>
<li>Птица</li>
<li>МакХейл</li>
<li>Пэриш</li>
</ol>
Если вы напишете список в Markdown следующим образом:
1.  Птица
1.  МакХейл
1.  Пэриш
или даже так:
3. Птица
1. МакХейл
8. Пэриш
вы получите точно такой же HTML-вывод. Суть в том, что если хотите, вы можете использовать порядковые номера в своих нумерованных списках Markdown, чтобы числа в исходном тексте совпадали с числами в опубликованном HTML. Но если вам лень, это не обязательно.

Таким образом, Markdown даже не обращает внимания на числа, потому что нумерованные списки в HTML не занимаются присвоением номеров. (Код в markdown-it действительно проверяет символ в первой позиции, но только для того, чтобы начать нумерацию с этого символа).

Кажется, есть ещё что-то помимо этого (например, согласованность форматирования на разных устройствах), но некоторые более необычные аспекты действительно кажутся очень вдохновлёнными HTML.

Тема		Ответов	Просм.
Markdown handling of whitespace in lists Support	5	1809	01.06.2017
CR's added between list entries when pasting Markdown Support	7	609	25.03.2020
Disable indent code block for emails Feature	20	1929	29.04.2020
Who would prefer a standard wysiwyg to markdown? Feature markdown	76	19374	12.03.2025
How do I disable Markdown completely? Support	19	2669	17.08.2016

Почему Markdown делает это? (удаление пробелов и другие функции)

Связанные темы