Форумы, запрещающие ИИ-контент… Как оно?

one1 · 19.Июнь.2026 03:00:56

Мне было бы очень интересно узнать о опыте форумов, где запрещён контент, сгенерированный ИИ/LLM. Как вы доводите это до сведения пользователей? Как вы выявляете такие материалы? Как вы взаимодействуете с пользователями, которые всё равно публикуют их?

Буду рад любым мыслям.

Примечание: Лично меня интересует только человеческий аспект взаимодействия на фронтенде сайта. Я предполагаю, что блокировка краулеров — дело безнадёжное.

Наш форум посвящён духовным и религиозным обсуждениям. Мы баним любой контент, созданный ИИ.

darkpixlz · 19.Июнь.2026 04:43:27

Большинство, если не все, тексты, созданные ИИ, можно легко обнаружить просто прочитав их. Технология SynthID от Google — это крутой инструмент для обнаружения изображений, созданных ИИ, и, по их утверждениям, она способна обнаруживать и тексты, вероятно, написанные только Gemini, но OpenAI также поддерживает этот стандарт. Способность лично распознавать такие тексты, вероятно, является приобретенным навыком, но я ценю работу, которая проводится для решения текущего кризиса, связанного с невозможностью обнаружения изображений или текстов, созданных ИИ.

По моему мнению, для этого по-прежнему правильным путем является блокировка (muting) или приостановка доступа, особенно если аккаунт новый. Если какой-то новый аккаунт присоединяется к вашему сайту и мгновенно публикует тему, сгенерированную ИИ, я не вижу причин, почему бы вам не просто приостановить работу этого аккаунта и заблокировать его.

Что касается всей проблемы со скрейпингом (сбором данных): мой сайт предназначен для внутренней коммуникации и документирования в небольшой компании на данный момент, и я планирую в будущем использовать его как бэкенд для ведения блога. Не составило труда настроить приманку (honeypot), чтобы отпугнуть роботов, которые игнорируют файлы robots.txt на моих доменах.

Только эта тактика привела к примерно 6 МИЛЛИОНАМ запросов за две недели (около 6 запросов в секунду к домену):

Когда ИИ-краулер посещает этот сайт, его направляют в бесконечный лабиринт спама с использованием проекта iocaine, размещенного на собственном сервере, с набором данных примерно из ~7000 вымышленных слов, некоторым бессмысленным HTML, случайными словами и фейковыми новостями, созданными 8-миллиардной моделью Llama.

Очевидно, что это ядерная тактика «уйди», и она подходит не всем, но она отлично помогла мне в моей цели — остановить LLM от использования моего кода или текстового контента. Я помню, как читал кейс-стади, которое Anthropic опубликовал о «отравлении» LLM, но я больше не могу найти эту статью, поэтому здесь она не прилагается, но, вероятно, в какой-то момент им придется заблокировать мой домен, когда они поймут, что их бот отправил на мой домен около 5 миллионов запросов, как это было недавно.

Ed_S · 19.Июнь.2026 08:24:27

(Я замечаю, что мы оставляем в стороне вопрос о нагрузке на краулеров, использовании краулерами контента для обучения, а также социальные и экономические последствия текущих стремительных изменений. Это хорошо.)

Что касается меня, на сайте с небольшим объемом трафика, посвященном хобби:

мы пытаемся согласовать и сформулировать письменную политику;
мы решаем проблемы по мере их возникновения;
самые вопиющие примеры по сути являются спамом, поэтому мы удаляем их и блокируем авторов;
в остальных случаях мы выражаем неодобрение, возможно, публично или приватно, и можем удалять сообщения.

Предлагаемая форма руководящих принципов может выглядеть так:

«Владеть» контентом сообщений, которые вы публикуете (т.е. читать и понимать его, а не слепо копировать и вставлять контент, независимо от его источника).
Пытаться сначала самостоятельно ответить на свои вопросы насколько это возможно (например, поиском по форуму), прежде чем создавать новые темы.
Излагать детали кратко и ясно, чтобы другие пользователи могли прочитать и понять их и оказать помощь, т.е. избегать длинных стен текста, состоящего из повторяющейся или нерелевантной информации, или слишком общих утверждений без достаточной информации.
Держать обсуждения в рамках темы, избегать мета-обсуждений (особенно вокруг использования ИИ — будь то «лучшие практики» или «этика их применения»).
Поддерживать уважительный тон общения и помнить, что у нас есть пользователи с разным опытом, взглядами и мнениями.
Получайте удовольствие! Это хобби.

(В нашей среде увлечений есть дополнительный аспект, а именно использование LLM в рамках хобби, что охватывает спектр возможностей и имеет как своих сторонников, так и противников.))

robbie.morrison · 26.Июнь.2026 09:18:47

Этот пример не касается Discourse, но вопросы политики и управления, безусловно, пересекаются.

Как английская, так и немецкая версии Википедии теперь имеют то, что я бы описал как крайне строгие правила в отношении чистоты контента, созданного ИИ. Будучи редактором с 16-летним стажем, я был необоснованно обвинён в добавлении контента, сгенерированного ИИ, в статью, которую я написал в основном сам. Процесс поиска решения оказался крайне изматывающим. Это включало подачу официальных жалоб в Комитет по арбитражу английской Википедии (ArbCom) и Группу доверия и безопасности Фонда Викимедиа (WMF TST) — на данный момент они были либо отклонены без рассмотрения, либо отвергнуты без объяснения причин.

Я не хочу пересказывать свой опыт здесь, отчасти потому, что он ещё продолжается. Однако я бы призвал читателей ознакомиться с этим необычным обменом мнениями, касающимся статьи английской Википедии о пещере Фёрн, месте культурного значения для народа модоки в Калифорнии:

https://en.wikipedia.org/wiki/User_talk:Gurkubondinn/Archives/2026#No_LLM_Mark_on_fern_caves.

Обвиняемый автор был вынужден четырежды отрицать использование ИИ. При этом его знания коренных народов также были обесценены. Редактор, осуществляющий контроль, завершает своё замечание фразой, которая внешне напоминает обеспокоенность, но может быть истолкована и как завуалированная угроза наложить санкции в случае невыполнения требований.

Подобные психологические тактики регулярно применяются контролирующими редакторами, и у меня есть доказательства других подобных случаев.

Если вы посмотрите на исходный код разметки в том же обмене мнениями, то обнаружите ловушку-«горшочек» с font-size: 0pt, созданную для выявления использования ИИ обвиняемым автором при составлении ответов. Эта ловушка не сработала.

Существуют достоверные сообщения о нескольких редакторах, покинувших немецкую Википедию после того, как их «несправедливо атаковали» из-за предполагаемого использования инструментов ИИ.

Отвечая на исходный вопрос, заданный в этой теме, я считаю, что английская и немецкая версии Википедии катастрофически не справляются со своим управлением множеством способов в своих попытках бороться с контентом, созданным ИИ. Я задокументировал три тематических исследования в своём недавнем 17-страничном отчёте для команды WMF TST. Возможно, я опубликую этот PDF-файл в ближайшее время.

robbie.morrison · 26.Июнь.2026 09:33:46

Я категорически не согласен, исходя из своего опыта работы в Википедии на английском языке (подробнее об этом я писал в других обсуждениях по этой теме). Я считаю, что такой подход в основном представляет собой псевдонауку, смешанную с высокомерием. Более того, опровергнуть такие методы обнаружения невозможно — и, что ещё важнее, редакторы Википедии, часто действующие согласованно, просто упираются при любых возражениях.

Обвиняемый редактор оказывается перед лицом обратного бремени доказывания и обвинений, которые невозможно опровергнуть — даже при наличии самых убедительных доказательств обратного. Естественная справедливость исчезает. Это не тот вид управления сообществом, который обычно оказывается эффективным.

Я знаю это не понаслышке. Я сам проходил через этот процесс. Это отвратительно. Должен существовать лучший способ.

RGJ · 26.Июнь.2026 09:39:30

Актуальные материалы, особенно вторая статья, открыли мне глаза при первом прочтении. Думаю, это в какой-то степени относится и к вам, @robbie.morrison. Некоторые люди «просто пишут так».

И я пришёл к такому тезису: я не пишу как ChatGPT. ChatGPT своим странным, лишённым тела, глобально ориентированным способом пишет как я. Или, точнее, он пишет как миллионы нас, кого пропустили через очень специфический образовательный и социальный конвейер, конвейер, намеренно созданный, чтобы стирать двусмысленность и придавать нашим мыслям очень определённую, очень формальную и очень впечатляющую форму.

one1 · 26.Июнь.2026 09:52:29

Да, предвзятость по отношению к тем, для кого английский не является родным, — одна из моих главных тревог.

Также это не сообщество Discourse, но это интересное чтение: Круглый стол по правилам XXI.V: Плагиат, честность и генеративный ИИ. Это из сабреддита AskHistorians. Для тех, кто не знаком: это, пожалуй, одно из самых строго модерирруемых сообществ на Reddit. Они практически допускают только ответы академического уровня на вопросы.

robbie.morrison · 26.Июнь.2026 10:09:21

На Reddit-сообществе AskHistorians по-прежнему сохраняется предвзятость «стреляй первым», за которой следует обратное бремя доказывания для обвиняемого (но, безусловно, больше процессуальных гарантий, чем в Википедии/Фонде Викимедиа):

Если вы не укажете, что использовали ИИ для генерации ответа, и мы будем подозревать, что вы используете ИИ нарушением правил, вас заблокируют. Однако каждому, кто был заблокирован за использование ИИ, сообщают, как подать апелляцию. Это кажется суровым, но одна из наших причин — перенаправить людей в modmail, чтобы мы могли провести обсуждение и избежать публичного разбирательства, которое может привести к травле.

Возможно, это единственная рабочая стратегия на данный момент? Но это едва ли соответствует принципам естественной справедливости.

one1 · 26.Июнь.2026 13:56:55

Да, я полагаю, этот сабреддит никак не связан с «сообществом». Они безжалостны в том, что принимают, независимо от того, использован ли ИИ или нет.

Но вообще обвинения кого-либо в использовании ИИ чреваты последствиями.

chapoi · 26.Июнь.2026 15:02:16

Я использовал тире с незапамятных времён, а теперь не могу, потому что люди подумают, что это ИИ. Прощай, длинное тире.

one1 · 26.Июнь.2026 15:47:30

Да, действительно, любой, кто использует Markdown и пишет качественный пост, может вызвать подозрения.

awesomerobot · 26.Июнь.2026 16:39:20

тоже! Я годами злоупотреблял длинным тире, пока не появился ИИ и не забрал его себе

Canapin · 26.Июнь.2026 16:41:14

Я делаю слишком много ошибок, чтобы меня ошибочно приняли за ИИ

Странно, но я заметил, что стал чаще добровольно не исправлять мелкие ошибки, которые замечаю в своих сообщениях (даже на французском, моем родном языке). Мне кажется, что оставление этих несовершенств делает то, что я пишу, более аутентичным и придает этому больше индивидуальности. Люди потенциально могут опознать сообщение как мое именно по этим ошибкам или странно написанным предложениям. Кроме того, это меньше утомляет психически — не пытаться сделать всё, что я пишу, идеальным (что бы это ни означало).

stephtara · 11.Июль.2026 06:01:31

Мое сообщество пока не очень активно, но я твердо убежден, что мы не хотим, чтобы люди публиковали контент, сгенерированный большими языковыми моделями (LLM). На данный момент я не против поисковых ботов (краулеров) и хотел бы, чтобы у нас был бот на базе LLM или системные сообщения от LLM, но я не хочу, чтобы участники выкладывали свою «кашу» от ChatGPT (у нас есть огромный объем тщательно созданной документации, которую мы хотим, чтобы люди использовали).

Это будет прописано в правилах, и мы будем «модерировать» такие публикации, когда заметим их, но меня интересуют автоматическое маркирование и другие стратегии.

Кстати, это франкоязычное сообщество.

eisammy · 11.Июль.2026 13:44:51

Честно говоря, я предпочитаю меньше тем и постов, которые гораздо интереснее в глобальной ленте. Даже для SEO это важно, поскольку индексация контента, созданного ИИ, обычно наказывается традиционными поисковыми системами.

В любом случае, поскольку Discourse в большинстве случаев имеет публичный характер, если я зайдут на другой форум, где ваш контент преобладает или смешан с «ИИ-хламом», я, естественно, уйду.

Jagster · 11.Июль.2026 13:59:07

Вот… здесь

eisammy · 11.Июль.2026 14:06:22

В чём именно ваша мысль? Существует большая разница между использованием в качестве инструмента, например, автоматического переводчика языков и тематического контента, как в случае с моим экземпляром, и другими аспектами. Возможно, вы были слишком буквальны в прочтении моего комментария, не так ли? Это искренний вопрос.

Jagster · 11.Июль.2026 14:10:26

Моя точка зрения заключается в том, что вы не столь категоричны, как утверждаете. Вы допускаете использование материалов, созданных ИИ, поскольку здесь они присутствуют. Чаще всего это касается кода, но разделы ask.discourse.org тоже не являются исключением.

Поэтому я призываю к последовательности

eisammy · 11.Июль.2026 14:13:29

Конечно, в жизни ничто не абсолютно, но, как вы rightly сказали, если контент в инстансе в основном или частично сгенерирован ИИ, я, естественно, его отклоню. Опять же, кажется, вы склонны использовать буквализм в обсуждениях, верно? Вместо иронии попробуйте в следующий раз быть более понятными.

merefield · 11.Июль.2026 19:06:11

Я не так уверен, что так легко обнаружить контент, сгенерированный ИИ с помощью тщательно продуманных промптов, чтобы избавиться от очевидных маркеров и паттернов.

Скорее всего, весь сайт будет помечен как «созданный ботом» в результате ручной проверки.

Поисковые системы ужасно справляются с его обнаружением.

Вот пример:

OpenAI Releases GPT-5.6 Soul, Terra and Luna Models - Geeky Gadgets.

Этот результат попал в топ-5 поисковой выдачи, но опечатка в слове Sol выдает его как низкокачественный контент.

Даже владельцы этого сайта его не проверяли. Ни один человек не допустил бы такой ошибки.

Тема		Ответов	Просм.
Block Google's "Help Me Write" Feature	19	2430	08.04.2024
Experiments with AI based moderation on Discourse Meta Community Building moderation , ai	11	1310	26.05.2025
Are you experiencing AI based spam? Community Building ai	22	2325	19.01.2025
What is stopping you from trying out Discourse AI? Community Building ai	35	2153	23.08.2025
How to prevent community content from being used to train LLMs like ChatGPT? Community Building	69	5205	16.07.2023

Форумы, запрещающие ИИ-контент… Как оно?

Связанные темы