Depuração ao adicionar um novo LLM

Isambard · Agosto 13, 2024, 12:01am

Estou tentando adicionar um LLM personalizado ao plugin Discourse AI. Quando pressiono o botão ‘testar’, recebo "Internal Server Error".

Existe alguma maneira de depurar isso ou obter uma mensagem de erro melhor? Quando entro na imagem do docker e uso curl em /v1/models, consigo buscar isso corretamente.

O nome do modelo é "models/Meta-Llama-3-8B-Instruct.Q6_K.gguf" e não tenho certeza se pode haver algum problema com caracteres especiais.

Isambard · Agosto 13, 2024, 12:15am

Tentar outro retorna: Tentando contatar o modelo retornou este erro: {\"error\":{\"code\":404,\"message\":\"File Not Found\",\"type\":\"not_found_error\"}}

Mas ele não exibe qual URL/modelo está tentando buscar, o que poderia ajudar na depuração.

As mesmas configurações foram coladas no Open WebUI, que foi capaz de contatar ambos os endpoints LLM e inferir corretamente.

Falco · Agosto 13, 2024, 12:23am

Qual servidor de inferência você está usando? vLLM?

Ao configurar a URL, adicione o caminho /v1/chat/completions no final.

Isambard · Agosto 13, 2024, 7:13am

Este foi o problema. Note que em software de LLM, é costume incluir apenas até /v1 como a URL do endpoint. A seleção de /chat/completion etc. é então normalmente adicionada pelo software.

Isambard · Agosto 13, 2024, 7:26am

Estou tentando executar um no localhost para testar, então coloquei o URL como: “http://172.17.0.1:8081/v1/chat/completions” e recebi um erro interno do servidor. Consigo usar o curl em “http://172.17.0.1:8081/v1/models” a partir do container docker do Discourse, então a conectividade está funcionando.

Existem outras armadilhas (por exemplo, o Discourse permite endpoints de LLM não HTTPS e com portas arbitrárias)?

Falco · Agosto 13, 2024, 1:51pm

Ambos devem funcionar.

Qual é o erro que você vê em /logs?

Isambard · Agosto 13, 2024, 5:36pm

Ah. Eu não sabia sobre /logs!

NameError (variável local indefinida ou método 'tokenizer' para uma instância de DiscourseAi::Completions::Dialects::ChatGpt) app/controllers/application_controller.rb:424:in 'block in with_resolved_local

Hmm. O que funciona é para um modelo que eu mesmo quantizei. Tentarei quantizar os outros para ver se é um problema de formato do modelo.

Isambard · Agosto 23, 2024, 11:43am

Alguém conseguiu fazer a API DeepSeek funcionar? Estou tentando descobrir a maneira correta de fazê-la funcionar com o Discourse.

Eu a tenho funcionando no Open WebUI e em outros clientes.

Lilly · Agosto 23, 2024, 2:11pm

Há um tópico aqui sobre isso

Tópico		Respostas	Visualizações
Internal Server Error 500- Manual configuration [ Discourse AI] Support ai	8	198	5 de Setembro de 2025
How do I use hugging face paid inference endpoints as Discourse custom LLMs Support ai-bot , ai	2	162	9 de Dezembro de 2024
Self-Hosting an OpenSource LLM for DiscourseAI Self-Hosting ai	7	3487	20 de Janeiro de 2026
Discourse AI with local ollama Internal Server Error Bug ai	2	60	28 de Dezembro de 2025
Getting discourse ai to work with ollama locally Support ai	15	453	6 de Abril de 2025

Depuração ao adicionar um novo LLM

Tópicos relacionados