Schätzung der Kosten für die Aktivierung von Discourse AI für verwandte Inhalte und Suche

SubStrider · 28. Oktober 2025 um 04:34

Gibt es eine Kostenrichtlinie, einen Maßstab oder eine Schätzformel, die mir hilft, die einmaligen (Massen-Einbettung) und laufenden (Einbettung und Suche) Kosten für die Aktivierung von Discourse AI mit einem Cloud-basierten LLM zu verstehen?

Welche typische Serverkonfiguration/Kosten wären für ein selbst gehostetes LLM erforderlich?

NateDhaliwal · 28. Oktober 2025 um 04:37

Ich glaube, ~~man bräuchte eine GPU~~ es ist besser mit einer GPU, wenn man selbst hosten möchte. Schauen Sie sich Dinge wie Ollama an.

Siehe auch:

Falco · 28. Oktober 2025 um 13:11

Verwandte Themen und KI-Suche verwenden kein LLM.

Es ist eine Anfrage pro Thema für Massen-Einbettungen, sodass die meisten Websites dies mit etwas wie der Gemini Free-Stufe tun können.

Die Suche ist eine Anfrage pro Suche und passt höchstwahrscheinlich in die kostenlose Stufe.

Da dies nur ein Einbettungsmodell ist, sollten Sie Qwen/Qwen3-Embedding-0.6B · Hugging Face mit GitHub - huggingface/text-embeddings-inference: A blazing fast inference solution for text embeddings models auf einem einfachen 2 vCPU / 4 GB RAM problemlos selbst hosten können.

Es ist natürlich schneller auf einem Server mit GPU, läuft aber auch ohne problemlos.

Thema		Antworten	Aufrufe
How to configure Discourse to use a locally installed LLM? Support ai	8	165	17. September 2025
Adding Semantic Search feature for our self-hosted discourse site Support ai , ai-search	9	190	19. März 2025
Self-Hosting Embeddings for DiscourseAI Self-Hosting ai-search , ai , related-topics	21	2235	14. April 2025
How to add a new Chat Bot connected to a self-hosted LLM? Dev ai-bot , ai	11	847	12. August 2024
Discourse AI - Self-Hosted Guide Self-Hosting ai	61	12374	30. April 2025