Cómo usar los endpoints de inferencia pagados de hugging face como LLMs personalizados de Discourse

StevePlex · 9 Diciembre, 2024 16:00

Tengo varios modelos LLM de código abierto ejecutándose en el servicio Hugging Face Inference Endpoint (esencialmente AWS)…

Para todos los modelos que he probado (llama, phi, gemma, etc.), puedo conectarme desde la página de configuración de Discourse LLM, pero la inferencia no funciona. Aquí está el error:

“Intentar contactar con el modelo devolvió este error: falta el campo inputs en la línea 1 columna 163”

¡¿Qué estoy haciendo mal!? Muchas gracias…

Vista desde Hugging Face:

Vista desde Discourse:

Falco · 9 Diciembre, 2024 16:07

Ha pasado más de un año desde la última vez que probé su API. ¿Es compatible con OpenAI hoy en día? Si es así, puedes intentar configurar Provider en OpenAI y apuntar a su endpoint.

StevePlex · 9 Diciembre, 2024 20:51

He probado la mayoría de los proveedores disponibles en la pantalla de configuración de Discourse LLM, incluido OpenAI.

O bien dan el error “No se pudo deserializar el cuerpo JSON al tipo de destino” o “Error interno del servidor”.

También probé un modelo real de OpenAI en el servicio de punto final de HF (¡GPT2! :)) pero eso no funcionó. .. errores del mismo tipo.

Tema		Respuestas	Vistas
Debugging adding new LLM Support ai	8	451	23 Agosto 2024
Self-Hosting an OpenSource LLM for DiscourseAI Self-Hosting ai	7	3685	20 Enero 2026
How to use the hugging face llama2 chat bot Development ai , ai-bot	2	599	9 Marzo 2024
Feature request: improve Discourse AI LLM setup (model discovery) and add AI config import/export Feature ai	0	76	26 Enero 2026
Configure API Keys for OpenAI Integrations how-to , ai	11	3687	11 Noviembre 2024

Cómo usar los endpoints de inferencia pagados de hugging face como LLMs personalizados de Discourse

Temas relacionados