Минимальная энтропия — запутанный термин

Я признаю свою некомпетентность в этом вопросе, но каждый раз, когда я хочу ослабить правила уникальности символов в заголовках и содержимом постов, я упираюсь в описания настроек body min entropy и title min entropy:

Минимальная энтропия (уникальные символы, для неанглийского языка учитывается больше) для тела поста.

Должен существовать способ изложить это более понятным человеческим языком. Изучив код (discourse/lib/text_sentinel.rb at 63ca30ccb415d133c65aee6758b7f34d9705eea7 · discourse/discourse · GitHub), я не уверен, что именно предложить. Если бы настройка принимала значение по шкале, скажем, от 1 до 10, это было бы проще объяснить.

Не стесняйтесь закрыть эту тему, если есть другие обсуждения, касающиеся этой проблемы.

7 лайков

В уведомлении о том, что название темы не допускается, содержится больше информации на человеческом языке, однако из него неясно, какие именно требования предъявляются к названию.

Уведомление:

Не знал об этой настройке. Из неё относительно ясно следует, что можно регулировать требуемое количество различных символов.

3 лайка

Это сложно, потому что настройка описывает алгоритм, но не предоставляет достаточно информации, чтобы было понятно, как именно он работает. Но да, по сути речь идёт о том: «от 0 до (?), какое разнообразие требуется в заголовках и содержании постов».

3 лайка

Я понимаю, что такое энтропия, но использование этих настроек стало ужасным опытом. Какие бы значения я ни пробовал, система постоянно раздражала. Сама настройка, возможно, и нужна, но поскольку я являюсь носителем очень маленького и довольно необычного языкового семейства — финского, — где мы используем много гласных, которые могут быть долгими, и то же самое с согласными, я установил для них нулевые значения.

Ещё раз: мой форум практически свободен от спама и предназначен для обычных взрослых людей, поэтому мне это даже не нужно. Я предполагаю, что ситуация не везде столь благополучная. Но я понимаю, почему это выглядит так запутанно.

4 лайка

Это, пожалуй, стоит вынести в отдельную тему, но именно настройка Discourse для взрослых сейчас является предметом моей работы.

5 лайков

Ну, конечно, это зависит от того, на кого ориентирован форум: на скандинавов, итальянцев, южноамериканцев (извините за обобщение), США (здесь тоже большое обобщение), академическое сообщество, геймеров, правых, левых… но я бы хотел сказать, что есть несколько универсальных правил:

  • Слишком много украшений и уловок — это уже перебор
  • Проблемы со спамом следует решать только при необходимости
  • Пользователи должны сразу получать права, которые им нужны, так что не играйте с уровнями доверия
  • Плохие элементы нужно сразу выгонять из форумов, без предупреждений
  • Геймификация — это просто ещё одна уловка

И часть этого — не использовать настройки энтропии.

4 лайка

Это уже второе подобное предупреждение, которое я видел — оно может быть полезным для того, чтобы побуждать людей писать полные предложения:

Однако ответить на этот вопрос невозможно: система запрещает публикацию поста, если в нём недостаточно энтропии, но это требование не объясняется автору.

Хотя минимальная длина заголовка выполняется при добавлении нескольких звёздочек, требование дополнительной энтропии могло бы быть сформулировано более подробно.

1 лайк

Моя стратегия заключается в ручной проверке первых нескольких постов, чтобы отфильтровать спам и другой низкокачественный контент. Все остальные ограничения, такие как количество символов, энтропия и прочая ерунда, мешают пользователям взаимодействовать с сайтом, поэтому они отключены (или, по крайней мере, установлены на крайне допустимый порог).

На данный момент нам удалось перехватить 100% спама, и ни один пользователь не столкнулся с расплывчатым сообщением о том, что в его посте недостаточно символов (что, парадоксально, скорее способствует распространению спама. Ведь самый простой способ обойти это сообщение — просто добавить шум из символов, пока не будет достигнут порог).

1 лайк

Описание «Минимальное количество уникальных символов» кажется мне вполне понятным — я не думаю, что здесь нужны изменения, особенно учитывая, что это очень незначительная настройка. (Однако комментарий NLS может сбить с толку: означает ли он, что национальный символ считается равным количеству байт UTF-8, которые он занимает?)

1 лайк