Представляем Discourse AI

Мы рады сообщить о запуске плагина Discourse AI — универсального решения для интеграции искусственного интеллекта и платформы Discourse, которое позволяет добавлять новые функции и улучшать существующие. В рамках первого релиза мы представляем семь различных модулей Discourse AI, призванных помочь администраторам сообществ, участникам и модераторам в выполнении самых разных задач: от анализа тональности до автоматической проверки текста и предложения правок. Продолжайте чтение, чтобы узнать больше о каждой из этих функций, а также о том, что планируется в нашей дорожной карте!


Это сопроводительная тема обсуждения к оригинальной публикации по адресу https://blog.discourse.org/2023/04/introducing-discourse-ai/
62 лайка

Это впечатляющий объем работы, @Falco и команда. Очень рады увидеть, как это будет работать на практике и какое влияние это окажет на управление сообществом в целом.

20 лайков

Спасибо за плагин. С нетерпением жду функцию извлечения текста из изображений.

6 лайков

Это именно те обновления, которые напоминают открытие нового рождественского подарка.

На момент написания этого текста у нас нет выделенного менеджера для нашего сообщества, и такие инструменты позволяют нам продолжать масштабирование без создания отдельной должности.

Не говоря уже о таких функциях, как помощник редактора, которые просто улучшают пользовательский опыт.

15 лайков

Вау, звучит потрясающе! С нетерпением жду появления функции ИИ в тарифном плане Business :slight_smile:

7 лайков

Я с нетерпением жду этого и добавлю это как можно скорее.

Есть ли планы использовать ИИ для обнаружения спама с постов/комментариев, созданных ИИ? Это огромная проблема (в целом) в сообществах.

9 лайков

Круто! Но… почему хорошие вещи всегда чертовски дорогие :sob:

1 лайк

:eyes:

Мне это нравится :smiley:

6 лайков

Что ж, если вы хотите генерировать текст или получать ответы, есть более дешёвая старая версия :stuck_out_tongue:

15 лайков

Привет, Роза,

Да, мы планируем исследовать эту область. Сложность в том, что у нас есть лишь небольшое количество примеров для подачи в GPT-4 из-за ограничений промптов; уложиться в лимит токенов действительно непросто. Однако у нас есть несколько других подходов, которые мы изучим и о которых сообщим.

Даже с очень небольшой дообучением GPT-4 справляется с оценкой материалов вполне неплохо:

13 лайков

Не могли бы вы попробовать с сообщением, содержащим большой блок кода или вывод системного журнала? На нашем сайте их Akismet постоянно помечает как спам.

9 лайков

Конечно, скинь мне пару ссылок

5 лайков

Если стоимость использования GPT-4 для этого приемлема, не поможет ли в данном случае дообучение GPT-3?

4 лайка

Вероятно, но дообучение модели обойдётся очень дорого. Некоторые люди получают отличные результаты, просто используя эмбеддинги — это, вероятно, следующий шаг, который стоит попробовать.

4 лайка

Когда я проверял, тонкая настройка оказалась значительно дешевле, чем я ожидал. Это сильно зависит от того, какой объем обучающих данных вы планируете использовать, но если сравнивать с размером модели, который можно разместить в одном GPT-4, речь идет о центах.

Я еще не дошел до этапа использования, поэтому, возможно, что-то упустил. Пожалуйста, поправьте меня, если я ошибаюсь.

https://openai.com/pricing

3 лайка

Обучение может быть очень, очень дорогим. В нашем случае, при расчетах стоимости обучения, только для минимального рекомендуемого OpenAI объема обучения, речь шла бы почти о 200 000 долларов за обучение для одного конкретного случая использования.

5 лайков

Все еще актуальна проблема, что новые пользователи путаются с лимитами TL1?

Если да, то, на мой взгляд, ИИ может стать хорошим решением: позволить новым пользователям делать больше, при этом ИИ будет внимательно следить за их действиями и помещать контент в очередь модераторов, если не уверен, что всё в порядке.

По вашему запросу: не спам-сообщения в Ask Fedora, помеченные Akismet:

7 лайков

Мне тоже очень интересно, как анализ тональности классифицирует это!

4 лайка

Никаких проблем, @Falco сегодня проводил исследование по этой теме, и результаты выглядят очень многообещающе: даже самый простой промпт работает удивительно хорошо. Спам просто чересчур очевиден.

Оставлю подробности за @Falco.

Ещё один интересный подход, который мы, возможно, сможем объединить, — это использование векторной базы данных. Если вы публикуете что-то, и ваш вектор оказывается близким к векторам 20 других спам-сообщений… значит, это, скорее всего, спам. Такой подход позволяет проводить тонкую настройку.

Честно говоря, я не вижу светлого будущего у Akismet. Мэтт, должно быть, сильно переживает по этому поводу в долгосрочной перспективе.

4 лайка