AI検索を有効にするとサーバーが停止した

昨夜、「AI埋め込みを有効にする」を有効にし、バックフィルがバックグラウンドで実行されていました。今日、「AI埋め込みセマンティック検索を有効にする」を有効にしたところ、CPUが常に100に急上昇し、sidekiqのキューに大量の遅延が発生しました。サーバーでの検索が完全に機能しなくなりました。

セマンティック検索を無効にしたところ、数分でサーバーのCPUは正常に戻り、キューもすべてクリアされました。

これは、別の方法で実行する方法があるのでしょうか、それともこれは想定されていることなのでしょうか?

「いいね!」 2

セルフホストされている場合の「ハードウェア」プロファイルについて、もっと詳しく知りたいです。私も自分のサーバーで同じことをしようと考えていましたが、その影響がわかりません。これは、様子を見るか、より良い計画を立てるべきだと私に示唆しています。

Jobs::GenerateEmbeddings がヒットするのに時間がかかるのは、データを取得するために埋め込みサービスに API コールを行っているためです。そのグラフは正常で、何かが時間がかかっていることを示しているだけで、実際にはクラウド上の別の GPU がその処理を行っています。

CPU の使用率が高くなるのは非常に予期せぬことであり、おそらく PG (PostgreSQL) のセットアップが非常にリソース不足の状態になり、一度に約 1000 個の数値を挿入することがそれに影響を与えた可能性があります。

診断を行うには、ここにはるかに多くのデータが必要です。サーバーの仕様は何ですか?実際の CPU グラフは何を示していますか?どのプロセスが CPU を消費していますか?使用している埋め込みサービスは何ですか?など…

サイドキックのジョブ期間グラフしか共有されていませんが、埋め込みを有効にした後、Discourse がそれらを正しくバックフィルしていることが示されています。

セットアップに関する詳細情報を共有していただけますか?埋め込みプロバイダーは何ですか?サードパーティの API ですか、それともセルフホストしていますか?トピックはいくつありますか?DB の仕様は?

私はDO 16 GBメモリ / 4 Intel vCPUサーバーを使用しており、OpenAIのtext-embedding-3-smallを利用しています。

セマンティック検索を有効にした際、CPU使用率は通常50%以下でした。投稿数は約250万件、トピック数は25万件です。プライベートメッセージ(PM)の埋め込みを有効にしていないため、さらに100万件の投稿と10万件のトピックが追加されることになります。

「いいね!」 1