Como usar os endpoints de inferência pagos do hugging face como LLMs personalizados do Discourse

StevePlex · Dezembro 9, 2024, 4:00pm

Tenho vários modelos LLM de código aberto rodando no serviço Hugging Face Inference Endpoint (essencialmente AWS)…

Para todos os modelos que testei (llama, phi, gemma, etc)… consigo me conectar a partir da página de configurações do Discourse LLM, mas a inferência não funciona. Aqui está o erro:

“Tentando contatar o modelo retornou este erro: Falha ao desserializar o corpo JSON para o tipo de destino: campo ausente inputs na linha 1 coluna 163”

O que estou fazendo de errado!? Muito obrigado…

Visualização do Hugging Face:

Visualização do Discourse:

Falco · Dezembro 9, 2024, 4:07pm

Faz mais de um ano desde que tentei a API deles pela última vez. Ela é compatível com OpenAI hoje em dia? Se sim, você pode tentar definir Provider como OpenAI e apontar para o endpoint deles.

StevePlex · Dezembro 9, 2024, 8:51pm

Tentei a maioria dos provedores disponíveis na tela de configuração do Discourse LLM, incluindo OpenAI.

Eles apresentam o erro “Falha ao desserializar o corpo JSON para o tipo de destino” ou “Erro interno do servidor”.

Também tentei um modelo real da OpenAI no serviço de endpoint HF (GPT2! mas isso não funcionou. .. mesmos tipos de erros.

Tópico		Respostas	Visualizações
Debugging adding new LLM Support ai	8	283	23 de Agosto de 2024
How to use the hugging face llama2 chat bot Dev ai , ai-bot	2	543	9 de Março de 2024
Self-Hosting an OpenSource LLM for DiscourseAI Self-Hosting ai	5	3166	21 de Fevereiro de 2025
Configure API Keys for OpenAI Integrations how-to , ai	11	3274	11 de Novembro de 2024
Internal Server Error 500- Manual configuration [ Discourse AI] Support ai	8	129	5 de Setembro de 2025

Como usar os endpoints de inferência pagos do hugging face como LLMs personalizados do Discourse

Tópicos relacionados