Gran parte de esto depende de “necesitamos evaluaciones”:
Tenemos:
Lo que necesitamos hacer aquí es:
- Añadir un gran conjunto de publicaciones de spam/ham al conjunto de evaluación (digamos 20-30 de cada una)
- Ejecutar la evaluación
- Corregir el prompt
- Ejecutar la evaluación de nuevo
De lo contrario, tendemos a estar a tientas en la oscuridad. cc @Falco