Discourse AI — руководство по самостоятельному размещению

Я, возможно — да, захочу воспользоваться услугой, но форум, который я планирую, находится на ранней стадии развития, поэтому пока недостаточно данных для анализа.

Поскольку вы работаете с этой технологией, не могли бы вы рассказать, какую роль играют теги в обучении ИИ? Я приложил огромные усилия к кластеризации корпуса одного из своих форумов, чтобы создать метки, которые затем можно было бы использовать для категоризации и тегирования тем. Хотя категоризация прошла очень успешно, внедрение тегов оказалось проблематичным из-за огромного количества терминов. Нет практического способа представить их все.

Думаю, ИИ мог бы использовать эти термины для улучшения собственных результатов.

1 лайк

На сегодняшний день в Discourse не предусмотрено обучение моделей. Все модели, используемые в настоящее время любыми модулями, уже обучены.

Теги могут пригодиться для добавления контекста в промпты для таких функций, как предложения тегов и связанные темы, но в данный момент они не используются.

2 лайка

Привет, @nodomain,

Discourse AI теперь будет хранить эмбеддинги в том же экземпляре БД, который мы используем для всего остального. Это значительно упрощает установку и обслуживание, а при обновлении мы автоматически импортируем эмбеддинги из старой базы данных. После этого вы сможете отключить старую базу данных.

1 лайк

А, теперь понятно, почему у меня возникли проблемы с настройкой:

I, [2023-07-18T09:29:11.218667 #1]  INFO -- : > cd /var/www/discourse && su discourse -c 'bundle exec rake db:migrate'
------------------------------DISCOURSE AI ERROR----------------------------------
    Discourse AI требует расширения pgvector для базы данных PostgreSQL.
         Выполните команду `./launcher rebuild app`, чтобы исправить это в стандартной установке.
            Либо вы можете удалить Discourse AI и выполнить пересборку.
------------------------------DISCOURSE AI ERROR----------------------------------

Моя база данных — RDS Aurora serverless v2, поэтому расширение pgvector использовать нельзя. Есть ли возможность вернуть старое поведение?

1 лайк

Отвечаю сам: осуществимым решением может стать переход на «несерверный» сервис Aurora: Neuigkeiten bei AWS – Innovationen und Neuigkeiten in Bezug auf die Cloud

Тем не менее я всё ещё заинтересован в ответе на свой вопрос.

2 лайка

Вы используете серверную архитектуру для основной базы данных Discourse или только для базы данных с эмбеддингами? Теперь Discourse AI хранит эмбеддинги в основной базе данных, и там должно быть включено расширение pgvector. Оно доступно в RDS PostgreSQL версии 13.11 и выше. В продакшене мы не используем Aurora, только RDS PostgreSQL, поэтому могу рекомендовать только это.

1 лайк

Для меня всё в порядке, спасибо.
И да, основная БД в данный момент бессерверная.

1 лайк

Значит ли это, что Amazon RDS PostgreSQL — это версия, упакованная в дистрибутив Docker?

RDS — это SaaS-решение от AWS, поэтому его нельзя упаковать в образ Docker.

Discourse AI работает как с версией PostgreSQL, которую мы упаковываем в наш образ Docker, так и с Amazon RDS или с любым экземпляром PostgreSQL, в котором установлен расширение.

Привет :waving_hand:
Могу ли я использовать открытую модель «Llama 2» от Meta для рекомендаций постов моим пользователям?
У кого-нибудь был опыт работы с таким инструментом?
Спасибо :folded_hands:

1 лайк

Вы имеете в виду рекомендацию «Связанных тем»? В таком случае — пока нет. На данный момент нет моделей эмбеддингов на базе Llama 2.

Стоит отметить, что те модели, которые мы предоставляем (одна с открытым исходным кодом и одна через API OpenAI), действительно хороши и более чем достаточны для работы функции «Связанные темы».

5 лайков

Спасибо за объяснение!

1 лайк

Существуют ли git-репозитории для образов Docker?

1 лайк

На данный момент нет, так как это потребовало бы поддерживать два отдельных репозитория: один с кодом приложения, а другой — с внутренними инструментами для сборки образов и их загрузки в наши внутренние репозитории. У меня просто не нашлось времени, чтобы правильно это настроить.

Код API полностью доступен внутри образа контейнера, хотя это и не самый удобный способ его изучения. По крайней мере, всё на месте.

3 лайка

Может ли кто-то поделиться точными минимальными и рекомендуемыми требованиями к серверу для форума со стандартным трафиком? Честно говоря, я хочу попробовать, но не знаю, с чего начать, так как нет четких требований к серверу.

2 лайка

Вам просто нужно попробовать то, что, по вашему мнению, разумно. Что-то с 16 ГБ оперативной памяти, похоже, является минимумом.

Для обычных пользователей, я полагаю, вы будете использовать стандартный сервер. :wink:

4 лайка

На моём форуме 200–250 пользователей онлайн, и ежедневно создаётся в среднем 300 сообщений. Поэтому это нельзя назвать слишком много, поэтому я назвал это стандартом. Я понимаю, что вы имеете в виду, но планирую арендовать новый сервер, так как текущий облачный сервер не позволяет выполнять много обновлений. Спасибо за ваш ответ :slight_smile:

2 лайка

На этот вопрос крайне сложно дать однозначный ответ.

Например, если вам просто нужно поработать с эмбеддингами, то достаточно Droplet за $6, работающего на процессоре (CPU). Этого хватит для доступа к функции «Похожие темы».

Если же вам нужны AIHelper и AIBot, у вас есть несколько вариантов:

  • Платить за каждый вызов через OpenAI. Стоимость будет зависеть от вашего использования.
  • Запустить открытую LLM на собственном сервере для обеспечения конфиденциальности. Однако для модели вроде Llama2-70B-Chat потребуется сервер стоимостью от 10 до 25 тысяч долларов в месяц.
  • Запустить открытую LLM в сервисе с почасовой оплатой. Например, вы можете запустить квантованную версию Llama2 через HuggingFace Endpoints за $6,50 в час. Сервис автоматически переходит в спящий режим, если в течение 15 минут не было запросов.

Сфера ML/Ops развивается стремительно: видеокарты (GPU) в огромном дефиците, а новые модели выходят каждый день. Предсказать будущее сложно, мы все находимся в процессе экспериментов.

5 лайков

Спасибо за подробное объяснение. Тогда я буду пробовать по одному плагину на каждом шаге. Думаю, я разберусь в деталях по ходу дела :slight_smile:

2 лайка

Пост был перемещен в новую тему: Внедрение Discourse AI на DigitalOcean