刚了解到这些用于创建更好提示的工具
也许将来有一天,它们可以被创建并整合到 Discourse 中,供那些创建提示的人使用。 ![]()
Funnel:将每个 eval 从二元结果(通过/失败)分解为一系列级联步骤,每个步骤都有自己的通过/失败标准。
Flux:Flux 是我们衡量漏斗中移动的量化指标。我们既查看总体 flux,以量化处理对我们漏斗的净结果,也按阶段细分 flux,以查看评估是如何从一个阶段过渡到另一个阶段的。
Orbit:Orbit 图将单个评估可视化,因为它们在代表漏斗的“轨道”中移动,早期阶段更靠近中心。这是对实验结果极其信息密集的视图。
图片
Funnel
Flux
Orbit


