Мы рады сообщить о запуске плагина Discourse AI — универсального решения для интеграции искусственного интеллекта и платформы Discourse, которое позволяет добавлять новые функции и улучшать существующие. В рамках первого релиза мы представляем семь различных модулей Discourse AI, призванных помочь администраторам сообществ, участникам и модераторам в выполнении самых разных задач: от анализа тональности до автоматической проверки текста и предложения правок. Продолжайте чтение, чтобы узнать больше о каждой из этих функций, а также о том, что планируется в нашей дорожной карте!
Это впечатляющий объем работы, @Falco и команда. Очень рады увидеть, как это будет работать на практике и какое влияние это окажет на управление сообществом в целом.
Это именно те обновления, которые напоминают открытие нового рождественского подарка.
На момент написания этого текста у нас нет выделенного менеджера для нашего сообщества, и такие инструменты позволяют нам продолжать масштабирование без создания отдельной должности.
Не говоря уже о таких функциях, как помощник редактора, которые просто улучшают пользовательский опыт.
Да, мы планируем исследовать эту область. Сложность в том, что у нас есть лишь небольшое количество примеров для подачи в GPT-4 из-за ограничений промптов; уложиться в лимит токенов действительно непросто. Однако у нас есть несколько других подходов, которые мы изучим и о которых сообщим.
Даже с очень небольшой дообучением GPT-4 справляется с оценкой материалов вполне неплохо:
Не могли бы вы попробовать с сообщением, содержащим большой блок кода или вывод системного журнала? На нашем сайте их Akismet постоянно помечает как спам.
Вероятно, но дообучение модели обойдётся очень дорого. Некоторые люди получают отличные результаты, просто используя эмбеддинги — это, вероятно, следующий шаг, который стоит попробовать.
Когда я проверял, тонкая настройка оказалась значительно дешевле, чем я ожидал. Это сильно зависит от того, какой объем обучающих данных вы планируете использовать, но если сравнивать с размером модели, который можно разместить в одном GPT-4, речь идет о центах.
Я еще не дошел до этапа использования, поэтому, возможно, что-то упустил. Пожалуйста, поправьте меня, если я ошибаюсь.
Обучение может быть очень, очень дорогим. В нашем случае, при расчетах стоимости обучения, только для минимального рекомендуемого OpenAI объема обучения, речь шла бы почти о 200 000 долларов за обучение для одного конкретного случая использования.
Все еще актуальна проблема, что новые пользователи путаются с лимитами TL1?
Если да, то, на мой взгляд, ИИ может стать хорошим решением: позволить новым пользователям делать больше, при этом ИИ будет внимательно следить за их действиями и помещать контент в очередь модераторов, если не уверен, что всё в порядке.
Никаких проблем, @Falco сегодня проводил исследование по этой теме, и результаты выглядят очень многообещающе: даже самый простой промпт работает удивительно хорошо. Спам просто чересчур очевиден.
Ещё один интересный подход, который мы, возможно, сможем объединить, — это использование векторной базы данных. Если вы публикуете что-то, и ваш вектор оказывается близким к векторам 20 других спам-сообщений… значит, это, скорее всего, спам. Такой подход позволяет проводить тонкую настройку.
Честно говоря, я не вижу светлого будущего у Akismet. Мэтт, должно быть, сильно переживает по этому поводу в долгосрочной перспективе.