Schätzung der Kosten für die Aktivierung von Discourse AI für verwandte Inhalte und Suche

SubStrider · 28. Oktober 2025 um 04:34

Gibt es eine Kostenrichtlinie, einen Maßstab oder eine Schätzformel, die mir hilft, die einmaligen (Massen-Einbettung) und laufenden (Einbettung und Suche) Kosten für die Aktivierung von Discourse AI mit einem Cloud-basierten LLM zu verstehen?

Welche typische Serverkonfiguration/Kosten wären für ein selbst gehostetes LLM erforderlich?

NateDhaliwal · 28. Oktober 2025 um 04:37

Ich glaube, ~~man bräuchte eine GPU~~ es ist besser mit einer GPU, wenn man selbst hosten möchte. Schauen Sie sich Dinge wie Ollama an.

Siehe auch:

Falco · 28. Oktober 2025 um 13:11

Verwandte Themen und KI-Suche verwenden kein LLM.

Es ist eine Anfrage pro Thema für Massen-Einbettungen, sodass die meisten Websites dies mit etwas wie der Gemini Free-Stufe tun können.

Die Suche ist eine Anfrage pro Suche und passt höchstwahrscheinlich in die kostenlose Stufe.

Da dies nur ein Einbettungsmodell ist, sollten Sie Qwen/Qwen3-Embedding-0.6B · Hugging Face mit GitHub - huggingface/text-embeddings-inference: A blazing fast inference solution for text embeddings models auf einem einfachen 2 vCPU / 4 GB RAM problemlos selbst hosten können.

Es ist natürlich schneller auf einem Server mit GPU, läuft aber auch ohne problemlos.

system · 27. November 2025 um 13:11

This topic was automatically closed 30 days after the last reply. New replies are no longer allowed.

Thema		Antworten	Aufrufe
Adding Semantic Search feature for our self-hosted discourse site Support ai , ai-search	9	231	19. März 2025
How to configure Discourse to use a locally installed LLM? Support ai	8	237	17. September 2025
Unlock All Discourse AI Features with Our Hosted LLM Announcements ai	8	478	17. Dezember 2025
Discourse AI - Self-Hosted Guide Self-Hosting ai	61	13066	30. April 2025
Self-Hosting Embeddings for DiscourseAI Self-Hosting ai-search , ai , related-topics	21	2483	14. April 2025