Este tópico aborda a configuração do módulo de Embeddings (Incorporações) do plugin Discourse AI. Ele explica o que são embeddings, como são usados e como configurá-los.
Nível de usuário necessário: Administrador
Embeddings são um componente crucial do plugin Discourse AI, possibilitando recursos como Tópicos Relacionados e Busca por IA. Este guia o orientará na configuração e uso de embeddings em sua instância do Discourse.
O que são Embeddings?
Embeddings são representações numéricas de texto que capturam o significado semântico. No Discourse, eles são usados para:
- Gerar tópicos relacionados na parte inferior das páginas de tópicos
- Habilitar a funcionalidade de busca semântica
Configurando Embeddings
Para clientes hospedados (hosted)
Se você é um cliente hospedado, os embeddings vêm pré-configurados. Você pode simplesmente habilitar os recursos de IA que dependem deles.
Para instâncias auto-hospedadas (self-hosted)
Se você está auto-hospedando, consulte o guia de auto-hospedagem do Discourse AI para instruções detalhadas de configuração.
Configurando Definições de Embedding
Os modelos de embedding agora são configurados como Definições de Embedding na interface de administração. Navegue até Admin → AI plugin → aba Embeddings. Ao adicionar uma nova definição de embedding, você pode escolher entre presets (modelos predefinidos) ou configurar um manualmente.
Os presets disponíveis incluem:
- text-embedding-3-large (OpenAI)
- text-embedding-3-small (OpenAI)
- text-embedding-ada-002 (OpenAI)
- gemini-embedding-001 (Google)
- bge-large-en (Hugging Face)
- bge-m3 (Hugging Face)
- multilingual-e5-large (Hugging Face)
Cada definição de embedding inclui: nome de exibição, provedor, URL, chave de API (ou AI Secret), tokenizador, dimensões, função de distância, comprimento máximo de sequência e prompts opcionais de incorporação/busca.
Configurando embeddings
Navegue até Admin → Plugins → Discourse AI, certifique-se de que as seguintes configurações estejam habilitadas.
- ai embeddings enabled: Ativa ou desativa o módulo de embeddings
- ai embeddings selected model: Seleciona qual definição de embedding usar para gerar embeddings
Configurações opcionais que podem ser ajustadas…
- AI embeddings generate for pms: Decide se deve gerar embeddings para mensagens privadas (pms)
- AI embeddings semantic related topics enabled: Habilita ou desabilita o recurso “Tópicos Relacionados”
- AI embeddings semantic related topics: O número máximo de tópicos relacionados a serem exibidos
- AI embeddings semantic related include closed topics: Incluir tópicos fechados nos resultados de tópicos relacionados
- AI embeddings semantic related age penalty: Aplica uma penalidade de idade exponencial aos tópicos nos resultados relacionados (0.0 desativa, valores mais altos penalizam tópicos mais antigos)
- AI embeddings semantic related age time scale: Escala de tempo em dias para o cálculo da penalidade de idade (padrão: 365)
- AI embeddings semantic search enabled: Habilita a busca de IA em página inteira
- AI embeddings semantic quick search enabled: Habilita a opção de busca semântica no pop-up do menu de busca
- AI embeddings semantic search use hyde: Habilita o HyDE (Hypothetical Document Embedding) para busca semântica
- AI embeddings semantic search hyde agent: O agente de IA usado para expandir termos de busca quando o HyDE está habilitado
Provedores
O Discourse AI suporta múltiplos provedores de embedding:
- OpenAI
- Hugging Face (para modelos open source/open weights)
- Cloudflare Workers AI
Para clientes hospedados, o Discourse fornece definições de embedding pré-configuradas (seedadas) que funcionam imediatamente.
Recursos
Tópicos Relacionados
Quando habilitada, uma seção “Tópicos Relacionados” aparece na parte inferior das páginas de tópicos, com links para discussões semanticamente semelhantes.
Busca por IA
Embeddings potencializam a opção de busca semântica na interface de busca de página inteira.
A busca semântica pode opcionalmente usar HyDE (Hypothetical Document Embedding). Quando habilitada via ai embeddings semantic search use hyde, o termo de busca é expandido usando o agente de IA configurado em ai embeddings semantic search hyde agent. A busca expandida é então convertida em um vetor e usada para encontrar tópicos semelhantes. Esta técnica adiciona alguma latência à busca, mas pode melhorar os resultados.
Ao selecionar um agente para HyDE, escolha um modelo rápido como Gemini Flash, Claude Haiku, GPT-4o Mini, ou os modelos mais recentes disponíveis.
Gerando embeddings
Embeddings são gerados automaticamente para novas postagens. Para gerar embeddings para conteúdo existente:
- O Discourse preencherá automaticamente embeddings para tópicos mais antigos através de um trabalho agendado que é executado a cada 5 minutos
- O preenchimento retroativo processa os tópicos em ordem de atividade recente primeiro
FAQs
P: Como os tópicos relacionados são determinados?
R: Tópicos relacionados são baseados unicamente em embeddings, que incluem o título, categoria, tags e o conteúdo das postagens
P: Posso excluir certos tópicos dos tópicos relacionados?
R: Sim, existe uma configuração do site para remover tópicos fechados dos resultados
P: Embeddings funcionam para postagens históricas?
R: Sim, o sistema preencherá automaticamente embeddings para todo o seu conteúdo




