Wie nutze ich die kostenpflichtigen Inference-Endpunkte von Hugging Face als benutzerdefinierte LLMs für Discourse

StevePlex · 9. Dezember 2024 um 16:00

Ich habe mehrere Open-Source-LLM-Modelle auf dem Hugging Face Inference Endpoint-Dienst (im Wesentlichen AWS) laufen.

Für alle getesteten Modelle (llama, phi, gemma usw.) kann ich mich von der Discourse LLM-Einstellungsseite aus verbinden, aber die Inferenz funktioniert nicht. Hier ist der Fehler:

„Der Versuch, das Modell zu kontaktieren, führte zu diesem Fehler: Fehlende Feld inputs in Zeile 1 Spalte 163“

Was mache ich falsch!? Vielen Dank..

Ansicht von Hugging Face:

Ansicht von Discourse:

Falco · 9. Dezember 2024 um 16:07

Es ist über ein Jahr her, seit ich ihre API das letzte Mal ausprobiert habe. Ist sie heutzutage OpenAI-kompatibel? Wenn ja, können Sie versuchen, Provider auf OpenAI zu setzen und auf deren Endpunkt zu verweisen.

StevePlex · 9. Dezember 2024 um 20:51

Ich habe die meisten Anbieter ausprobiert, die auf dem Discourse LLM-Einrichtungsbildschirm verfügbar sind, einschließlich OpenAI.

Entweder erhalten sie die Fehlermeldung „Fehler beim Deserialisieren des JSON-Bodys in den Zieltyp“ oder „Interner Serverfehler“.

Ich habe auch ein echtes OpenAI-Modell auf dem HF-Endpunktdienst ausprobiert (GPT2! aber das hat nicht funktioniert. .. die gleichen Fehler.

Thema		Antworten	Aufrufe
Debugging adding new LLM Support ai	8	288	23. August 2024
How to use the hugging face llama2 chat bot Dev ai , ai-bot	2	543	9. März 2024
Self-Hosting an OpenSource LLM for DiscourseAI Self-Hosting ai	5	3188	21. Februar 2025
Configure API Keys for OpenAI Integrations how-to , ai	11	3281	11. November 2024
Internal Server Error 500- Manual configuration [ Discourse AI] Support ai	8	130	5. September 2025

Wie nutze ich die kostenpflichtigen Inference-Endpunkte von Hugging Face als benutzerdefinierte LLMs für Discourse

Verwandte Themen