Включение AI-поиска привело к сбою моего сервера

SubStrider · 07.Март.2026 11:56:06

Вчера вечером я включил опцию «AI embeddings enabled», и процесс заполнения данных (backfill) выполнялся в фоновом режиме. Сегодня я включил опцию «AI embeddings semantic search enabled», и загрузка процессора постоянно достигала 100%, при этом образовалась огромная очередь LOW в Sidekiq. Поиск на сервере полностью перестал работать.

Я отключил семантический поиск, и через несколько минут загрузка процессора вернулась к норме, а вся очередь была очищена.

Так есть ли способ сделать это иначе, или такое поведение ожидаемо?

rburkej · 08.Март.2026 19:43:35

Мне бы очень хотелось узнать больше о вашем профиле «железа», если вы используете самохостинг. Я тоже думал о том же для своих серверов, но не уверен в последствиях. Этот anecdotal опыт подсказывает мне, что стоит пока подождать или подготовить более продуманный план.

sam · 09.Март.2026 01:29:02

Время выполнения Jobs::GenerateEmbeddings должно составлять секунды, так как вы делаете API-запрос к сервису эмбеддингов для получения данных. Этот график нормален: он просто показывает, что операция занимает время, поскольку работу выполняет другой GPU в облаке.

Высокая загрузка CPU очень неожиданна. Возможно, ваш сервер PostgreSQL изначально был сильно перегружен, и вставка около 1000 чисел подряд оказалась достаточной, чтобы его нагрузить.

Нам нужно гораздо больше данных для диагностики: какие характеристики у сервера? Что именно показывают графики CPU, какой процесс потребляет ресурсы, какой сервис эмбеддингов вы используете и так далее…

Falco · 09.Март.2026 03:09:22

Я вижу, что вы поделились только графиком длительности работы Sidekick, и он показывает, что после включения эмбеддингов Discourse корректно выполнил их обратное заполнение.

Можете ли вы предоставить больше информации о вашей конфигурации? Кто является поставщиком эмбеддингов? Это сторонний API или вы также размещаете его самостоятельно? Сколько у вас тем? Какие характеристики у базы данных?

SubStrider · 09.Март.2026 11:54:35

Я использую сервер DigitalOcean с 16 ГБ оперативной памяти и 4 виртуальными процессорами Intel.

Использую Open AI text-embedding-3-small.

Загрузка процессора обычно составляет около 50% или меньше. Вот как это выглядело после включения семантического поиска. У нас около 2,5 млн сообщений и 250 тыс. тем. Я не включил генерацию эмбеддингов для личных сообщений, иначе пришлось бы добавить ещё 1 млн сообщений и 100 тыс. тем.

Тема		Ответов	Просм.
Getting a lot of no results for semantic search Support ai , ai-search	20	613	13.03.2025
Is header semantic search still experimental? Support ai , ai-search	9	196	14.10.2024
Discourse AI - Embeddings Site Management ai , ai-search , related-topics	20	6874	07.07.2025
Semantic quick search gives error 500 Support ai , ai-search	1	386	05.04.2024
Estimating cost of enabling Discourse AI for related content and search Support ai	2	157	28.10.2025

Включение AI-поиска привело к сбою моего сервера

Связанные темы