تقديم Discourse AI

للذين يتساءلون ما هي قاعدة بيانات المتجهات

ملاحظة: هذا من بائع تجاري لقاعدة بيانات المتجهات ولكنه لا يزال أفضل مقدمة أعرفها وهو نفس قاعدة بيانات المتجهات التي تستخدمها OpenAI.

لفهم ما يعنيه المتجه فيما يتعلق بنموذج المحولات، شاهد هذا الفيديو التقني على يوتيوب

4 إعجابات

نحن نستخدم GitHub - pgvector/pgvector: Open-source vector similarity search for Postgres في discourse-ai ولكننا نفكر في أفكار أخرى على المدى الطويل مثل weaviate / elastic / milvus

Pinecone هو مستخدم لـ Discourse :hugs: https://community.pinecone.io/

11 إعجابًا

نعم يا سام، نحن سعداء بأننا من عملاء Discourse، وأحد أكثر التطبيقات شيوعًا مع GPT-4 للحالة الاستخدامية التي ذكرتها بالضبط - انظر الشعارات + الاقتباسات على صفحتنا الرئيسية. هل يمكننا مساعدتك في إثبات المفهوم؟

8 إعجابات

بالتأكيد، سأقوم بتوصيلك بـ @Falco ويمكنكم مناقشة الأمر.

أعتقد أنه سيكون من الرائع شحن discourse-ai مع محول pinecone أيضًا، فهو يقلل قدرًا هائلاً من الاحتكاك للمستضيفين الذاتيين لمنصتنا.

7 إعجابات

يبدو أنك قد أجريت بحثك حول تكاليف التدريب، ولكني أردت مشاركة فهمي بناءً على دليل الضبط الدقيق لـ OpenAI. إذا فهمت https://platform.openai.com/docs/guides/fine-tuning بشكل صحيح، فإنهم يوصون باستخدام Ada لمهام التصنيف وتقديم 100 مثال لكل فئة. في هذه الحالة، سيكون لدينا ما مجموعه 200 مثال (بريد مزعج وغير مزعج). بافتراض أن المثال المتوسط يتكون من 500 رمز مميز، سيكون الإجمالي 500 * 200 = 100,000 رمز مميز على Ada، والذي سيكلف 0.04 دولار أمريكي للتدريب. إذا كنت ستستخدم Davinci بدلاً من ذلك، فستكون التكلفة 3.00 دولارات أمريكية.

أعتقد أن التسعير قد يكون لخطوة واحدة أو حقبة تدريب واحدة، لكنني لم أتمكن من العثور على مزيد من المعلومات التفصيلية على موقعهم على الويب. يرجى إعلامي إذا كانت لديك أي رؤى أو إذا كنت قد أسأت فهم شيء ما.

إعجابَين (2)

كما ذكرت، كانت تلك التكاليف لحالة الاستخدام الخاصة بي لعملي. تدريبي واستخدامي هو Davinci، وليس Ada، لذا فهو أغلى بـ 75 مرة هناك. كما أننا نستخدم الحد الأقصى للرموز لكل طلب تقريبًا.

لا أعرف بالضبط ما يدور في ذهن Sam/Falco لحالة استخدامهما - أذكر فقط بشكل عام أن الضبط الدقيق يمكن أن يكون مكلفًا على نطاق واسع!

إعجابَين (2)

تهانينا على الإصدار @sam و @Falco!

يسعدني دعم Discourse بتقييم Weaviate! :clap:

7 إعجابات