推理 token 消耗了 max_tokens 完成限制中的所有 token。这也是我们不使用推理进行翻译的另一个原因。
max_tokens
我们曾有一个站点设置来处理这个问题
但我们在以下提交中将其移除了