昨夜、「AI埋め込みを有効にする」を有効にし、バックフィルがバックグラウンドで実行されていました。今日、「AI埋め込みセマンティック検索を有効にする」を有効にしたところ、CPUが常に100に急上昇し、sidekiqのキューに大量の遅延が発生しました。サーバーでの検索が完全に機能しなくなりました。
セマンティック検索を無効にしたところ、数分でサーバーのCPUは正常に戻り、キューもすべてクリアされました。
これは、別の方法で実行する方法があるのでしょうか、それともこれは想定されていることなのでしょうか?
「いいね!」 2
rburkej
(Robert Johnson)
2
セルフホストされている場合の「ハードウェア」プロファイルについて、もっと詳しく知りたいです。私も自分のサーバーで同じことをしようと考えていましたが、その影響がわかりません。これは、様子を見るか、より良い計画を立てるべきだと私に示唆しています。
sam
(Sam Saffron)
3
Jobs::GenerateEmbeddings がヒットするのに時間がかかるのは、データを取得するために埋め込みサービスに API コールを行っているためです。そのグラフは正常で、何かが時間がかかっていることを示しているだけで、実際にはクラウド上の別の GPU がその処理を行っています。
CPU の使用率が高くなるのは非常に予期せぬことであり、おそらく PG (PostgreSQL) のセットアップが非常にリソース不足の状態になり、一度に約 1000 個の数値を挿入することがそれに影響を与えた可能性があります。
診断を行うには、ここにはるかに多くのデータが必要です。サーバーの仕様は何ですか?実際の CPU グラフは何を示していますか?どのプロセスが CPU を消費していますか?使用している埋め込みサービスは何ですか?など…
Falco
(Falco)
4
サイドキックのジョブ期間グラフしか共有されていませんが、埋め込みを有効にした後、Discourse がそれらを正しくバックフィルしていることが示されています。
セットアップに関する詳細情報を共有していただけますか?埋め込みプロバイダーは何ですか?サードパーティの API ですか、それともセルフホストしていますか?トピックはいくつありますか?DB の仕様は?
私はDO 16 GBメモリ / 4 Intel vCPUサーバーを使用しており、OpenAIのtext-embedding-3-smallを利用しています。
セマンティック検索を有効にした際、CPU使用率は通常50%以下でした。投稿数は約250万件、トピック数は25万件です。プライベートメッセージ(PM)の埋め込みを有効にしていないため、さらに100万件の投稿と10万件のトピックが追加されることになります。
「いいね!」 1