Autohosting di Embeddings per DiscourseAI

michaelfeil · 31 Dicembre 2024, 2:45pm

Un amico mi ha appena inviato questo thread tramite DM.

Pro/Contro:

infinity supporta embedding multimodali (ovvero invia immagini/audio) a
supporto GPU AMD
più modelli supportati nello stesso container (controlla il modello tramite il parametro model).
più dtypes, ad esempio quantizzazione int8 dei pesi (principalmente questo è irrilevante, la memoria di attivazione è maggiore)
nuovi modelli spesso escono tramite “codice di modellazione personalizzato” spedito nel repository huggingface. Infinity legge questo codice pytorch se necessario. Questo ti aiuterà ad evitare la richiesta “puoi supportare modelli xyz” su base continuativa)
più modelli supportati (ad esempio debertav2 per mixedbread)

Contro:

Argomento		Risposte	Visualizzazioni
Can´t set ai embedding model Support ai	4	119	Luglio 16, 2025
Discourse AI - Embeddings Site Management ai , ai-search , related-topics	24	6370	Ottobre 15, 2025
Self-Hosting an OpenSource LLM for DiscourseAI Self-Hosting ai	7	3514	Gennaio 20, 2026
What do I need to insert into the 'ai embeddings discourse service api endpoint' Support ai	3	159	Gennaio 7, 2024
Discourse AI - Self-Hosted Guide Self-Hosting ai	61	13144	Aprile 30, 2025