このドキュメントトピックがありました。
毎日新しいモデルがリリースされるため、最新の状態に保つのは非常に困難です。ただし、一般的なルールとして、GPT4-o はほぼすべての AI に適しています。
Evals については、確かに検討・テスト中です。