Как использовать платные эндпоинты вывода Hugging Face в качестве пользовательских LLM в Discourse

StevePlex · 09.Декабрь.2024 16:00:27

У меня запущено несколько моделей LLM с открытым исходным кодом на сервисе Hugging Face Inference Endpoint (по сути, AWS)..

Для всех протестированных моделей (llama, phi, gemma и др.) я могу подключиться со страницы настроек LLM в Discourse, но вывод данных не работает. Вот ошибка:

“Попытка связаться с моделью вернула следующую ошибку: Не удалось десериализовать тело JSON в целевой тип: отсутствует поле inputs на строке 1, столбце 163”

Что я делаю не так!? Большое спасибо..

Вид с Hugging Face:

Вид из Discourse:

Falco · 09.Декабрь.2024 16:07:04

Прошло уже больше года с тех пор, как я последний раз пробовал их API. Совместим ли он сейчас с OpenAI? Если да, то можно попробовать установить Provider в значение OpenAI и указать их конечную точку.

StevePlex · 09.Декабрь.2024 20:51:15

Я попробовал почти всех провайдеров, доступных на экране настройки Discourse LLM, включая OpenAI.

Либо возникает ошибка «Не удалось десериализовать тело JSON в целевой тип», либо «Внутренняя ошибка сервера».

Также я попробовал реальную модель OpenAI через сервис конечных точек Hugging Face (GPT2! , но это тоже не сработало… те же самые ошибки.

Тема		Ответов	Просм.
Debugging adding new LLM Support ai	8	481	23.08.2024
Self-Hosting an OpenSource LLM for DiscourseAI Self-Hosting ai	12	3875	06.07.2026
How to use the hugging face llama2 chat bot Development ai , ai-bot	2	632	09.03.2024
Feature request: improve Discourse AI LLM setup (model discovery) and add AI config import/export Feature ai	0	86	26.01.2026
Configure API Keys for OpenAI Integrations how-to , ai	11	3804	11.11.2024

Как использовать платные эндпоинты вывода Hugging Face в качестве пользовательских LLM в Discourse

Связанные темы