Auto-hospedagem de Embeddings para DiscourseAI

michaelfeil · Dezembro 31, 2024, 2:45pm

Um amigo acabou de me enviar este tópico por DM.

Alguns Prós/Contras:

o infinity suporta embeddings multimodais (ou seja, enviar imagens/áudio) para o
suporte a GPU amd
vários modelos suportados no mesmo contêiner (controle o modelo via parâmetro model).
mais dtypes, por exemplo, quantização int8 dos pesos (principalmente isso é irrelevante, a memória de ativação é maior)
novos modelos frequentemente são lançados via “código de modelagem personalizado” enviado no repositório huggingface. O Infinity lê este código pytorch, se necessário. Isso o ajudará a evitar o “você pode suportar modelos xyz” de forma contínua)
mais modelos suportados (por exemplo, debertav2 para mixedbread)

Contras:

Tópico		Respostas	Visualizações
Can´t set ai embedding model Support ai	4	89	16 de Julho de 2025
Discourse AI - Embeddings Site Management ai , ai-search , related-topics	24	6034	15 de Outubro de 2025
What do I need to insert into the 'ai embeddings discourse service api endpoint' Support ai	3	150	7 de Janeiro de 2024
Discourse AI - Self-Hosted Guide Self-Hosting ai	61	12411	30 de Abril de 2025
Estimating cost of enabling Discourse AI for related content and search Support ai	2	46	28 de Outubro de 2025