Ho appena scoperto questi strumenti per creare prompt migliori
Forse un giorno in futuro potrebbero essere creati e incorporati per coloro che creano prompt con Discourse. ![]()
Funnel: scompone ogni eval da un esito binario di superato/fallito in una serie di passaggi a cascata, ognuno con i propri criteri di superamento/fallimento.
Flux: Flux è la nostra misura quantitativa del movimento attraverso il funnel. Esaminiamo il flux sia in aggregato, per quantificare l’esito netto di un trattamento sul nostro funnel, sia suddiviso per fase, per vedere come gli eval passano da una fase all’altra.
Orbit: Il grafico orbit visualizza i singoli eval mentre si muovono attraverso “orbite” che rappresentano il funnel, con le fasi iniziali più vicine al centro. È una visualizzazione estremamente ricca di informazioni di un risultato sperimentale.
Immagini
Funnel
Flux
Orbit


