Autoalojamiento de Embeddings para DiscourseAI

michaelfeil · 31 Diciembre, 2024 14:45

Un amigo me acaba de enviar este hilo por mensaje directo.

Algunos pros/contras:

Infinity admite embeddings multimodales (es decir, enviar imágenes/audio) a
Soporte de GPU AMD
Múltiples modelos compatibles en el mismo contenedor (controla el modelo a través del parámetro model).
Más dtypes, por ejemplo, cuantificación int8 de los pesos (en su mayoría esto es irrelevante, la memoria de activación es mayor)
A menudo salen nuevos modelos a través de “código de modelado personalizado” enviado en el repositorio de Hugging Face. Infinity lee este código de PyTorch si es necesario. Esto te ayudará a evitar el “puedes soportar modelos xyz” de forma continua.
Más modelos compatibles (por ejemplo, debertav2 para mixedbread)

Contras:

Tema		Respuestas	Vistas
Can´t set ai embedding model Support ai	4	117	16 Julio 2025
Discourse AI - Embeddings Site Management ai , ai-search , related-topics	24	6328	15 Octubre 2025
Self-Hosting an OpenSource LLM for DiscourseAI Self-Hosting ai	7	3498	20 Enero 2026
What do I need to insert into the 'ai embeddings discourse service api endpoint' Support ai	3	158	7 Enero 2024
Discourse AI - Self-Hosted Guide Self-Hosting ai	61	13100	30 Abril 2025