Bathinda
(Bathinda Helper)
2024 年 3 月 18 日午前 7:36
1
当社の「D」サイトでAI画像キャプションを生成するには、OpenAIの有料プラン(アカウントに事前にクレジット残高を保持しておく必要があります)を使用するか、無料のオープンソースLlava Ai APIを使用できます。
しかし、Llava APIキーの生成方法についてガイダンスを得るために、3時間Google検索をしましたが、多くのビデオを見ても、正しい方向への指示を得ることができませんでした。
Llavaのインターフェース/ウェブサイトには、必要なAPIキーを直接生成するオプションがないようです。
ユーザーにとって、好奇心旺盛なユーザーを正しい方向に導く「小さなリンク」があれば非常に貴重だと思います。これに似たものです。
あるいは、こちらの方が良いでしょう。
Lilly
(Lillian Louis)
2024 年 3 月 18 日午前 10:56
2
お探しのものはこれですか? APIトークンを取得する
「いいね!」 1
Bathinda
(Bathinda Helper)
2024 年 3 月 18 日午後 1:07
3
ありがとうございます。
しかし、それはおそらく私を1歩前進させたにすぎないことがわかりました。なぜなら、Google Gemini の場合は、D-Site の設定にキーを入力するとすぐに、Gemini に依存するすべてのものが完璧に機能し始めたからです。
しかし、あなたが教えてくれた Hugging Face API シークレットキーを Disco 設定に入力した後でも、画像キャプションは「エラー 500」を返します(画像キャプションは、「Open-Ai Gpt4-Vision Preview」を画像キャプションモデルとして選択すると正常に機能します)。
また、Llava は異なるように見えるため、Hugging Face または Llava という名前の D-Site 設定に多くの空のフィールドがあります(なぜある場所で Llava を使用し、別の場所で Hugging Face を使用するのかも混乱の原因となっています)。これらは冗長ではないと確信しています。
そこで、D-Site 設定のこれらの空のフィールドすべてに値を設定するのに役立つ、またはこれを適切に実装するためのインターネット上のリソースを教えていただけますか。
Falco
(Falco)
2024 年 3 月 18 日午後 3:39
5
LLaVaでは、現時点ではghcr.io/xfalcox/llava:latestコンテナイメージを介したセルフホスティングのみをサポートしています。
VRAMが24GB以上のGPUを搭載したサーバーにアクセスできる場合は、セルフホスティングが可能です。それ以外の場合は、GPT-4Vを使用することをお勧めします。
「いいね!」 2
system
(system)
クローズされました:
2024 年 4 月 17 日午後 3:40
6
This topic was automatically closed 30 days after the last reply. New replies are no longer allowed.