Discourse AI — руководство по самостоятельному размещению

DonH · 29.Июнь.2023 18:07:39

Я, возможно — да, захочу воспользоваться услугой, но форум, который я планирую, находится на ранней стадии развития, поэтому пока недостаточно данных для анализа.

Поскольку вы работаете с этой технологией, не могли бы вы рассказать, какую роль играют теги в обучении ИИ? Я приложил огромные усилия к кластеризации корпуса одного из своих форумов, чтобы создать метки, которые затем можно было бы использовать для категоризации и тегирования тем. Хотя категоризация прошла очень успешно, внедрение тегов оказалось проблематичным из-за огромного количества терминов. Нет практического способа представить их все.

Думаю, ИИ мог бы использовать эти термины для улучшения собственных результатов.

Falco · 30.Июнь.2023 14:33:44

На сегодняшний день в Discourse не предусмотрено обучение моделей. Все модели, используемые в настоящее время любыми модулями, уже обучены.

Теги могут пригодиться для добавления контекста в промпты для таких функций, как предложения тегов и связанные темы, но в данный момент они не используются.

Falco · 13.Июль.2023 18:38:59

Привет, @nodomain,

Discourse AI теперь будет хранить эмбеддинги в том же экземпляре БД, который мы используем для всего остального. Это значительно упрощает установку и обслуживание, а при обновлении мы автоматически импортируем эмбеддинги из старой базы данных. После этого вы сможете отключить старую базу данных.

nodomain · 18.Июль.2023 16:50:42

А, теперь понятно, почему у меня возникли проблемы с настройкой:

I, [2023-07-18T09:29:11.218667 #1]  INFO -- : > cd /var/www/discourse && su discourse -c 'bundle exec rake db:migrate'
------------------------------DISCOURSE AI ERROR----------------------------------
    Discourse AI требует расширения pgvector для базы данных PostgreSQL.
         Выполните команду `./launcher rebuild app`, чтобы исправить это в стандартной установке.
            Либо вы можете удалить Discourse AI и выполнить пересборку.
------------------------------DISCOURSE AI ERROR----------------------------------

Моя база данных — RDS Aurora serverless v2, поэтому расширение pgvector использовать нельзя. Есть ли возможность вернуть старое поведение?

nodomain · 18.Июль.2023 19:50:46

Отвечаю сам: осуществимым решением может стать переход на «несерверный» сервис Aurora: Neuigkeiten bei AWS – Innovationen und Neuigkeiten in Bezug auf die Cloud

Тем не менее я всё ещё заинтересован в ответе на свой вопрос.

Falco · 18.Июль.2023 20:54:42

Вы используете серверную архитектуру для основной базы данных Discourse или только для базы данных с эмбеддингами? Теперь Discourse AI хранит эмбеддинги в основной базе данных, и там должно быть включено расширение pgvector. Оно доступно в RDS PostgreSQL версии 13.11 и выше. В продакшене мы не используем Aurora, только RDS PostgreSQL, поэтому могу рекомендовать только это.

nodomain · 18.Июль.2023 20:55:43

Для меня всё в порядке, спасибо.
И да, основная БД в данный момент бессерверная.

DonH · 18.Июль.2023 22:48:57

Значит ли это, что Amazon RDS PostgreSQL — это версия, упакованная в дистрибутив Docker?

Falco · 18.Июль.2023 22:52:22

RDS — это SaaS-решение от AWS, поэтому его нельзя упаковать в образ Docker.

Discourse AI работает как с версией PostgreSQL, которую мы упаковываем в наш образ Docker, так и с Amazon RDS или с любым экземпляром PostgreSQL, в котором установлен расширение.

ValGun · 19.Июль.2023 11:55:00

Привет
Могу ли я использовать открытую модель «Llama 2» от Meta для рекомендаций постов моим пользователям?
У кого-нибудь был опыт работы с таким инструментом?
Спасибо

Falco · 19.Июль.2023 13:31:00

Вы имеете в виду рекомендацию «Связанных тем»? В таком случае — пока нет. На данный момент нет моделей эмбеддингов на базе Llama 2.

Стоит отметить, что те модели, которые мы предоставляем (одна с открытым исходным кодом и одна через API OpenAI), действительно хороши и более чем достаточны для работы функции «Связанные темы».

ValGun · 19.Июль.2023 13:41:36

Спасибо за объяснение!

Firefishy · 02.Август.2023 15:09:15

Существуют ли git-репозитории для образов Docker?

Falco · 02.Август.2023 16:57:52

На данный момент нет, так как это потребовало бы поддерживать два отдельных репозитория: один с кодом приложения, а другой — с внутренними инструментами для сборки образов и их загрузки в наши внутренние репозитории. У меня просто не нашлось времени, чтобы правильно это настроить.

Код API полностью доступен внутри образа контейнера, хотя это и не самый удобный способ его изучения. По крайней мере, всё на месте.

anilguven · 03.Август.2023 13:35:09

Может ли кто-то поделиться точными минимальными и рекомендуемыми требованиями к серверу для форума со стандартным трафиком? Честно говоря, я хочу попробовать, но не знаю, с чего начать, так как нет четких требований к серверу.

pfaffman · 03.Август.2023 13:50:03

Вам просто нужно попробовать то, что, по вашему мнению, разумно. Что-то с 16 ГБ оперативной памяти, похоже, является минимумом.

Для обычных пользователей, я полагаю, вы будете использовать стандартный сервер.

anilguven · 03.Август.2023 14:14:02

На моём форуме 200–250 пользователей онлайн, и ежедневно создаётся в среднем 300 сообщений. Поэтому это нельзя назвать слишком много, поэтому я назвал это стандартом. Я понимаю, что вы имеете в виду, но планирую арендовать новый сервер, так как текущий облачный сервер не позволяет выполнять много обновлений. Спасибо за ваш ответ

Falco · 03.Август.2023 15:04:04

На этот вопрос крайне сложно дать однозначный ответ.

Например, если вам просто нужно поработать с эмбеддингами, то достаточно Droplet за $6, работающего на процессоре (CPU). Этого хватит для доступа к функции «Похожие темы».

Если же вам нужны AIHelper и AIBot, у вас есть несколько вариантов:

Платить за каждый вызов через OpenAI. Стоимость будет зависеть от вашего использования.
Запустить открытую LLM на собственном сервере для обеспечения конфиденциальности. Однако для модели вроде Llama2-70B-Chat потребуется сервер стоимостью от 10 до 25 тысяч долларов в месяц.
Запустить открытую LLM в сервисе с почасовой оплатой. Например, вы можете запустить квантованную версию Llama2 через HuggingFace Endpoints за $6,50 в час. Сервис автоматически переходит в спящий режим, если в течение 15 минут не было запросов.

Сфера ML/Ops развивается стремительно: видеокарты (GPU) в огромном дефиците, а новые модели выходят каждый день. Предсказать будущее сложно, мы все находимся в процессе экспериментов.

anilguven · 03.Август.2023 17:32:06

Спасибо за подробное объяснение. Тогда я буду пробовать по одному плагину на каждом шаге. Думаю, я разберусь в деталях по ходу дела

Stephen · 04.Август.2023 17:40:43

Пост был перемещен в новую тему: Внедрение Discourse AI на DigitalOcean

Тема		Ответов	Просм.
關於Discourse AI Support ai	5	842	01.10.2024
Discourse AI plugin with self hosted discourse site Support ai	2	344	09.07.2024
Self-Hosting an OpenSource LLM for DiscourseAI Self-Hosting ai	12	3869	06.07.2026
Introducing Discourse AI Blog	26	4126	04.05.2023
I want to install Discourse AI on Discourse Self-hosting ai	12	596	19.05.2024