Stima del costo per abilitare Discourse AI per contenuti e ricerche correlate

SubStrider · 28 Ottobre 2025, 4:34am

Esiste un benchmark di costo, un metro di paragone o una formula di stima che mi aiuti a comprendere il costo una tantum (mass embedding) e quello continuativo (embedding e ricerca) per abilitare Discourse AI utilizzando un LLM basato su cloud?

Per un LLM self-hosted, quale sarebbe una tipica configurazione/costo del server richiesto?

NateDhaliwal · 28 Ottobre 2025, 4:37am

Credo che ~~avresti bisogno di una GPU~~ sia meglio con una GPU se vuoi fare l’auto-hosting. Dai un’occhiata a cose come Ollama.

Vedi anche:

Falco · 28 Ottobre 2025, 1:11pm

Gli argomenti correlati e la ricerca AI non utilizzano un LLM.

È una richiesta per argomento per gli embedding di massa, quindi la maggior parte dei siti dovrebbe essere in grado di farlo utilizzando qualcosa come il livello gratuito di Gemini.

La ricerca è una richiesta per ricerca, e che molto probabilmente può rientrare nel livello gratuito.

Poiché questo è solo un modello di embedding, dovresti essere in grado di eseguire l’host di Qwen/Qwen3-Embedding-0.6B · Hugging Face utilizzando GitHub - huggingface/text-embeddings-inference: A blazing fast inference solution for text embeddings models su un sistema base con 2 vCPU / 4 GB di RAM senza problemi.

È più veloce su un server con GPU, ovviamente, ma funziona benissimo anche senza.

Argomento		Risposte	Visualizzazioni
How to configure Discourse to use a locally installed LLM? Support ai	8	165	Settembre 17, 2025
Adding Semantic Search feature for our self-hosted discourse site Support ai , ai-search	9	190	Marzo 19, 2025
Self-Hosting Embeddings for DiscourseAI Self-Hosting ai-search , ai , related-topics	21	2235	Aprile 14, 2025
How to add a new Chat Bot connected to a self-hosted LLM? Dev ai-bot , ai	11	847	Agosto 12, 2024
Discourse AI - Self-Hosted Guide Self-Hosting ai	61	12361	Aprile 30, 2025

Stima del costo per abilitare Discourse AI per contenuti e ricerche correlate

Argomenti correlati