Estimación del costo de habilitar Discourse AI para contenido y búsqueda relacionados

SubStrider · 28 Octubre, 2025 04:34

¿Existe algún punto de referencia de costos, lista de verificación o fórmula de estimación que me ayude a comprender el costo único (incrustación masiva) y continuo (incrustación y búsqueda) de habilitar Discourse AI utilizando un LLM basado en la nube?

Para un LLM autoalojado, ¿cuál sería una configuración/costo de servidor típico requerido?

NateDhaliwal · 28 Octubre, 2025 04:37

Creo que ~~necesitarías una GPU~~ es mejor con una GPU si quieres autoalojarlo. Consulta cosas como Ollama.

También consulta:

Falco · 28 Octubre, 2025 13:11

Temas relacionados y búsqueda de IA no usan un LLM.

Es una solicitud por tema para incrustaciones masivas, por lo que la mayoría de los sitios podrán hacerlo utilizando algo como el nivel gratuito de Gemini.

La búsqueda es una solicitud por búsqueda, y es muy probable que quepa en el nivel gratuito.

Dado que este es solo un modelo de incrustación, deberías poder autoalojar Qwen/Qwen3-Embedding-0.6B · Hugging Face usando GitHub - huggingface/text-embeddings-inference: A blazing fast inference solution for text embeddings models en un servidor básico de 2 vCPU / 4 GB de RAM sin problemas.

Es más rápido en un servidor con GPU, por supuesto, pero funciona perfectamente en uno sin ella.

Tema		Respuestas	Vistas
How to configure Discourse to use a locally installed LLM? Support ai	8	165	17 Septiembre 2025
Adding Semantic Search feature for our self-hosted discourse site Support ai , ai-search	9	190	19 Marzo 2025
Self-Hosting Embeddings for DiscourseAI Self-Hosting ai-search , ai , related-topics	21	2235	14 Abril 2025
How to add a new Chat Bot connected to a self-hosted LLM? Dev ai-bot , ai	11	847	12 Agosto 2024
Discourse AI - Self-Hosted Guide Self-Hosting ai	61	12369	30 Abril 2025