Erro em qualquer ferramenta de IA sem parâmetros, por exemplo, "tags"

Tenho uma avaliação para ferramentas sem parâmetros:

E ela passa com:

sam@arch evals % ./run -e no_params_tool
Running evaluation 'no_params_tool'
GPT-4o: Passed 🟢
GPT-4o-mini: Passed 🟢
Claude 3.5 Haiku: Passed 🟢
Claude 3.5 Sonnet: Passed 🟢
Gemini 2.0 Flash: Passed 🟢
Gemini 2.0 pro: Passed 🟢

Você testou na versão mais recente?

1 curtida