Hébergement auto pour Embeddings pour DiscourseAI

michaelfeil · Décembre 31, 2024, 2:45

Un ami vient de m’envoyer ce fil de discussion par DM.

Quelques Pour/Contre :

infinity prend en charge les embeddings multimodaux (c’est-à-dire l’envoi d’images/audio)
prise en charge des GPU AMD
plusieurs modèles pris en charge dans le même conteneur (contrôlez le modèle via le paramètre model).
plus de dtypes, par exemple la quantification int8 des poids (principalement cela est sans importance, la mémoire d’activation est plus grande)
de nouveaux modèles sortent souvent via du “code de modélisation personnalisé” expédié dans le dépôt huggingface. Infinity lit ce code pytorch si nécessaire. Cela vous évitera d’avoir à demander en permanence “pouvez-vous prendre en charge les modèles xyz”)
plus de modèles pris en charge (par exemple, debertav2 pour mixedbread)

Contre :

Sujet		Réponses	Vues
Can´t set ai embedding model Support ai	4	119	Juillet 16, 2025
Discourse AI - Embeddings Site Management ai , ai-search , related-topics	24	6370	Octobre 15, 2025
Self-Hosting an OpenSource LLM for DiscourseAI Self-Hosting ai	7	3515	Janvier 20, 2026
What do I need to insert into the 'ai embeddings discourse service api endpoint' Support ai	3	159	Janvier 7, 2024
Discourse AI - Self-Hosted Guide Self-Hosting ai	61	13145	Avril 30, 2025