В смежном вопросе один из колумнистов WSJ провел 30 тестов с чат-ботом для заказа через drive-through сети Hardee’s, и он, по-видимому, справился довольно хорошо: только 3 случая потребовали передачи человеку для ответа.
Можете дать ссылку на объявление?
Это немного прояснит ситуацию для тех из нас, кто не в курсе (гипербыстрых) событий ![]()
Отлично, спасибо @RGJ ![]()
Похоже, речь идет конкретно об этом обязательстве:
Поэтому я считаю, что именно компаниям следует обеспечить это. Но водяные знаки для текста, как уже упоминал выше @merefield, поставить практически невозможно.
Чего бы вы ожидали от Discourse в данном случае, @MikeNolan? Если пользователь просто копирует и вставляет текст, сгенерированный ИИ, у Discourse нет способа узнать об этом (за исключением запуска детекторов спама и ИИ), поэтому я не вижу, как именно это соглашение что-то изменит на данный момент.
С контентом, скопированным пользователем и сгенерированным ИИ, у Discourse, вероятно, не получится много сделать, так как он, скорее всего, неотличим от контента, созданного человеком (за исключением того, что он может быть лучше написан). Однако, если вы используете официальный плагин Discourse AI, возможно, Discourse сможет что-то сделать с водяными знаками или иным образом обозначать сгенерированный им контент?
А, в таком случае, да, я понимаю, почему это имеет смысл ![]()
Мы начали работу над этим, например, вот эта самая сводка темы имеет водяной знак:
Работа над интерфейсом сводки получила наибольшее внимание, поэтому мы уже близки к финальной форме и настроили это здесь. Остальное последует за этим.
Возможно, это немного семантически, но две характеристики цифровых водяных знаков заключаются в том, что они не видны случайному зрителю и их трудно удалить.
Я считаю, что ОТКРЫТОЕ признание контента, созданного с помощью ИИ, важно как для текста, так и для изображений.
Скрытые цифровые подписи более полезны для таких задач, как защита авторских прав на изображения.
Я активно участвую в форуме фотографов Ugly Hedghog, где тема того, считаются ли изображения, созданные или измененные с помощью ИИ, фотографиями, является предметом жарких дискуссий. (Некоторые изображения, созданные с помощью ИИ, уже выигрывали фотоконкурсы.)
Проблема, которую мы сейчас обсуждаем, заключается в том, что злоумышленники будут использовать ИИ для генерации контента, а затем удалять указание на его происхождение, пытаясь выдать его за созданный человеком. Это подразумевает необходимость наличия «метки» происхождения, которую трудно удалить.
Намерения не обязательно злонамеренны, но они не вполне честны.
Удачи в поиске способа «метить» сгенерированный ИИ текст, который нельзя обойти чем-то, возможно, столь же примитивным, как копирование и вставка.
Можно ли для этого использовать символы нулевой ширины?
Нет, их можно легко удалить, пропустив текст через фильтр, который оставляет только обычные алфавитные символы. Водяные знаки на тексте — это очень, очень сложно. По сути, это невозможно сделать на уровне представления символов.
Эта статья в блоге Скотта Аронсона немного объясняет, как это может работать. Прокрутите вниз до раздела «Мои проекты в OpenAI». Метод, описанный там, защищён от копирования и вставки @MikeNolan
Спасибо, это интересно:
Мой основной проект на данный момент — это инструмент для статистического водяного знака выводов текстовой модели, такой как GPT. По сути, всякий раз, когда GPT генерирует какой-либо длинный текст, мы хотим, чтобы в его выборе слов был незаметный секретный сигнал, который можно использовать позже, чтобы доказать: да, это вышло из GPT. Мы хотим, чтобы было гораздо сложнее взять вывод GPT и выдать его за текст, созданный человеком. Это может быть полезно для предотвращения академического плагиата, очевидно, но также, например, для массовой генерации пропаганды… Или для имитации чьего-либо стиля письма с целью оговорить человека. Это всё вещи, которые, вероятно, стоит усложнить, верно?
…
Таким образом, для добавления водяного знака вместо случайного выбора следующего токена идея состоит в том, чтобы выбирать его псевдослучайно, используя криптографическую псевдослучайную функцию, ключ к которой известен только OpenAI. Это не создаст никакой заметной разницы для конечного пользователя, при условии, что конечный пользователь не сможет отличить псевдослучайные числа от истинно случайных.
Одна из моих опасений по поводу попыток выявить текст, созданный ИИ, заключается в том, что это может случайно затронуть хорошо написанный текст, созданный человеком.
Хорошо написанный текст, созданный человеком, кажется, является исключением на многих форумах. :вздох:
Я просто возвращаюсь к вопросу мотивации.
Если выявлен злой умысел — бан или приостановка.
Если это хорошо написанный текст с добрыми намерениями и подтверждёнными фактами — оставить?
А что, если родной язык пользователя не английский, и он использовал ChatGPT для улучшения грамматики?
Хорошо, я беспокоюсь, что это может затронуть мои посты ![]()
Я так думаю. Я не вижу проблемы в том, что люди используют ИИ для помощи в составлении постов, при условии, что реальное решение о том, стоит ли публиковать сгенерированный ИИ текст, принимает человек.
Существует множество инструментов, которые могут помочь улучшить грамматику. Я не знаю, лучше ли ChatGPT остальных.
Улучшение грамматики — это несколько иной вопрос, чем создание «оригинального» контента. В то же время владельцы контента начинают оспаривать действия ИИ-систем, требуя компенсации за использование их материалов для обучения этих систем.


