Nosso endpoint de teste é um pouco enganoso e isso é algo que eu gostaria de corrigir.
Atualmente, testamos apenas endpoints “não de streaming”. O “streaming” não é testado.
Tudo funciona se você desativar o streaming no seu LLM, talvez ele não seja implementado pelo seu proxy.