Безрассудное и безудержное внедрение ChatGPT во всё и вся вызывает серьезную обеспокоенность.
Возникает вопрос, который администратору важно знать: существует ли какая-либо часть или компонент, даже самый маленький, который по сути является ИИ в основной установке Discourse?
Я предполагаю, что ответ — нет, но хочу убедиться.
С появлением плагинов, которые, как кажется, изолируют ИИ от основной установки Discourse, я также считаю важным узнать с точки зрения дорожной карты, планируется ли когда-либо интегрировать ИИ туда, где его сейчас нет (если это действительно так).
Если на один или несколько из этих вопросов ответ «да», было бы здорово получить подтверждение.
В настоящее время все функции, связанные с ИИ, находятся в необязательном плагине Discourse AI.
Что касается того, запланированы ли какие-либо основные функции ИИ, я передам слово более компетентным людям (но я бы предположил, что этого нет в плане работ).
Да, отличный момент касательно определений. Я считаю, что автор исходного поста (OP) ясно обозначил суть в общих чертах: речь идёт о ситуации до и после появления ChatGPT (+ аналогичных моделей) и о планах для Discourse, по крайней мере, в следующих направлениях:
использование для написания основного кода;
интеграция в ядро системы.
Если кто-то ещё хочет помочь сформулировать определение в этом духе, то, как вы и заметили, лучшей дефиницией, вероятно, будет всё, что не является «хорошим старым кодом, созданным человеком и реализующим традиционную процедурную логику».
Можете ли вы предоставить мне несколько (скажем, 10 крупных) примеров проектов с открытым исходным кодом, у которых есть устав или публичный документ, запрещающий использование GitHub Copilot?
Да, именно поэтому я задал этот вопрос так широко, имея в виду бота-программиста. Теперь, когда я об этом знаю, думаю, что речь идёт о проверке орфографии и грамматики (например, Grammarly), а также о программах-помощниках и ассистентах, таких как Copilot. Полагаю, чёткого и однозначного ответа здесь нет, верно?
В крайнем случае, как насчет инструментов рефакторинга в IDE? Запрет на извлечение метода? Продолжайте плыть по этой волне, и мы вернемся к перфокартам.
Добавлю ещё: Discourse (и многие плагины) используют обширные наборы функциональных тестов и проверок линтинга.
Это значительно снижает риск возникновения проблем с кодом (попробуйте развёртывать в RoR без проверок…) и также охватывает код, сгенерированный ИИ, или код с поддержкой Copilot. К тому же, не стоит забывать, что Copilot может даже найти проблемы, которые вы упустили…
Дисциплина в отношении тестирования на платформе безупречна и служит примером для всей экосистемы.
Впрочем, этот вопрос уже во многом спорный? Я не думаю, что развёртывание кода ИИ без участия человека произойдёт в ближайшее время… Вы даже не сможете дойти до этапа запуска тестов (попробуйте попросить ChatGPT найти решение на EmberJS, совместимое с Discourse. Галлюцинации зашкаливают ). Возможно, это улучшится по мере развития моделей.
Discourse должен идти в ногу со временем или погибнуть, на мой взгляд, а это означает исследование и внедрение новых технологий там, где это уместно.
Как автор двух плагинов на тему «ИИ» (оба написаны вручную! ), я понимаю, что они, очевидно, должны сопровождаться оговорками и отказами от ответственности, и я не вижу, чтобы это изменилось в ближайшее время…
Так что в рамках «Discourse», чтобы придерживаться исходного поста (OP), поскольку вы плывете по этой волне и следующей, конечно, это обширная тема, но:
Где мы находимся на данный момент (если я правильно понимаю обратную связь).
В ядре Discourse нет активных компонентов ИИ.
В ядре Discourse нет неактивных компонентов ИИ или кода.
Часть или весь код Discourse мог быть создан с косвенным или прямым использованием инструментов ИИ на различных платформах разработки и в IDE, доступных разработчикам.
Добавление любых функций ИИ в ядро в настоящее время не входит в дорожную карту.
Плагины являются шлюзом для функций на базе ИИ, работающих с Discourse.
ИИ — это не технический термин… один человек может интерпретировать эвристику как ИИ. То, как мы «оцениваем» сообщения, присваивая вес лайкам, прочтениям и просмотрам, можно считать ИИ. Akismet тоже можно назвать «ИИ». Список бесконечен.
На данный момент отрасль «обеспокоена» безопасностью ИИ в контексте больших языковых моделей.
На данный момент ядро Discourse и плагин Discourse AI не поставляют никаких больших языковых моделей. Discourse AI интегрирует существующие большие языковые модели через API, которые администраторы могут указать (OpenAI и Anthropic); в будущем мы, вероятно, будем поддерживать ещё больше моделей.
Большая языковая модель (LLM) — это языковая модель, состоящая из нейронной сети с множеством параметров, обученной на больших объёмах непомеченного текста с использованием методов глубокого обучения. Эти модели способны распознавать, обобщать, переводить, предсказывать и генерировать текст и другие формы данных. За последние годы LLM добились значительного прогресса, демонстрируя выдающиеся результаты в самых разных задачах и трансформируя области искусственного интеллекта, науки и общества в целом [1][2].
Примерами больших языковых моделей являются GPT-3 от OpenAI, который обучен предсказывать следующее слово в предложении, подобно функции автозаполнения текста в сообщениях [3].
Текст через Google + GPT-4
Мне кажется, что многие из этих обсуждений несколько озадачивают. Есть ли опасения, что мы «заразим» исходный код Discourse? Есть ли опасения, что у нас возникнет жёсткая безусловная зависимость от OpenAI?
Я определенно предпочитаю термин «стохастический попугай», введённый Эмили Бендер и Тимнит Гебру — он, безусловно, точнее описывает эти большие языковые модели.
Вы имеете в виду через плагины, как это происходит сейчас?
Мой взгляд таков: если вы действительно запутались, я бы поставил на то, что вы не так активно осведомлены или не проявляете достаточной эмпатии к «последствиям», потому что, возможно, нет видимой ценности в том, чтобы разбираться в этом, поскольку лошадь уже убежала, а ворота сарая распахнуты настежь, и все просто разбежались!
Вы говорите «рак», я бы сказал, скорее, квантовое оружие массового [вставьте пропущенное слово], хотя некоторые сочтут это преувеличением. Это нормально. У каждого есть право на своё мнение, но я думаю в целом, а не конкретно о Discourse: то, что вы делаете с разработкой, зависит от того, как это работает. Чтобы прояснить точку в отношении оригинального поста (OP):
Основная причина, по которой я задаю этот вопрос, заключается в том, что как администратор Discourse вы несёте ответственность перед вашей пользовательской базой. И хотя это может быть крошечный сегмент с точки зрения реального рынка, ваша пользовательская база или её часть всё же важны, и они могут не захотеть использовать платформу, которая задействует любые формы этого поколения ИИ при создании контента, по многим разным причинам. Точно так же, как они используют блокировщики рекламы, они не хотят быть частью этой «вещи» — когда первый пользователь задаёт такой вопрос, это происходит потому, что у вас нет чётко обозначенной политики в отношении ИИ, и вы также должны иметь какой-то правдивый ответ.
Поэтому разделение инструментов ИИ на плагины, не входящие в ядро, — это хороший подход. Но если бы ИИ стал частью ядра, скажем, в будущем обновлении, это могло бы вызвать колебания или даже полный отказ от платформы.
Пока эта грань остаётся чёткой и обозначенной, это может стать приемлемым путём вперёд, и здесь также важны чёткие указания для разработчиков и заверения.
Я также понимаю, что трудно сформулировать что-то так, чтобы все были полностью согласны, но вот суть проблемы сейчас: именно так происходит, когда вопрос задаётся по серьёзным причинам. Если причина обоснована или непреклонна, она станет основой для того, чтобы пользователи принимали ценностные решения, которые превращаются в действия.
Если всё сводится к простому утверждению, что в ядре Discourse нет ChatGPT или подобного ИИ, с оговоркой, что некоторый ИИ используется в разработке и создании как инструмент, это может быть максимально близким к удовлетворительному ответу для обычного пользователя на форуме Discourse.
В целом вопрос о том, как ИИ повлияет на веб и, соответственно, на мир, уже обсуждался и рассматривался с точки зрения применения и последствий. Эта фаза официального выпуска этих «игрушек», то есть открытие ящика Пандоры с API и всем остальным для мира разработчиков и, следовательно, для всего мира, представляет собой эскалацию, поскольку до этого была очень контролируемая экспериментальная и относительно скрытая фаза, когда этот ИИ уже много лет был внедрён в значительную часть веба, и многие обычные люди даже не осознавали этого.
Другой аспект — реклама. Я предполагаю, что Google уже давно использует ИИ такого рода для показа рекламы и даже аналитических сервисов, но, по крайней мере, пока пользователи могут использовать блокирующее программное обеспечение и VPN. Используют ли эти инструменты тоже ИИ?!
Возможно, всё сводится к тому, как люди воспринимают ИИ. И, возможно, самый простой способ это сформулировать: одни видят его как изолированный (инструменты), другие видят его как пожар в самой ткани матрицы реальности, который нужно потушить. В любом случае это происходит и будет происходить, что бы ни случилось, но всегда есть последствия, и иногда у вас есть только выбор: быть частью создания этих последствий или смягчать их. То, что происходит с «индустрией», по моему мнению, представляет собой и то, и другое одновременно.
Если вы просите меня сказать: «С этого момента … до конца вселенной вы можете гарантировать, что большие языковые модели никогда не попадут в основной продукт»… ответ — нет.
Если вы спрашиваете: «Смогу ли я отказаться от этого, если что-то подобное произойдёт?» Мой ответ — … вероятно… мы, как правило, предоставляем администраторам огромную свободу в настройках и конфигурации сайта.
Теперь, спрашивал бы я вас сказать что-то иное, чем то, что есть, ведь это было бы неразумно, как показывает ваш ответ выше: кто может знать на бесконечной временной шкале? Конечно, речь действительно идёт о попытке определить текущую позицию ядра Discourse по максимально эффективному использованию активного ИИ.
Я также не ищу никаких обещаний.
Мое основное предложение, высказанное до получения ответа, остаётся прежним.
Рассмотрите возможность отделения активного ИИ от ядра, чтобы владельцы и администраторы могли сделать чёткий выбор без путаницы. Я предпочитаю такой подход, а не просто переключатель «вкл/выкл» в панели администратора. Называйте меня параноиком и консерватором, если хотите, но я думаю об аналоге «воздушного разрыва».
То, что ChatGPT и подобные ему системы внедряются в столь многие платформы и инструменты, поражает воображение, и в широком смысле последствия этого огромны. Так почему бы Discourse не упустить этот шанс (хотя на самом деле он его не упустил — плагин стал тем самым событием в истории разработки Discourse)?
Я считаю, что вопрос прояснён настолько, насколько это возможно, и надеюсь, что если произойдёт заметное изменение в расстановке сил, будет сделано очень чёткое заблаговременное уведомление в подходящий срок.
Наличие форума с активным ИИ, глубоко встроенным в ядро, может оказаться для некоторых администраторов, владельцев и/или сообществ слишком большим шагом в сторону «Скайнетта», и я считаю, что ИИ следует рассматривать как нечто большее, чем просто парадигмальный сдвиг уровня meta+.