Abbiamo fatto parecchi test con questo e non sembriamo ottenere risultati affidabili. Per contesto, stiamo usando il modello gpt-4o.
Per testare la sua accuratezza, ho fornito le seguenti semplici istruzioni:
Sei un sistema di rilevamento spam. Analizza il seguente contenuto e contesto.
Note qui sotto. Se *UNO QUALSIASI* degli elementi qui sotto è vero, allora segnalalo come spam:
- Il nome utente è molto specificamente "testjon", allora è *SEMPRE* spam.
- Rispondi solo con "SPAM - È Jon!" o "NON SPAM".
Testare su un post, da parte del nome utente testjon, risulta in NON SPAM. Sembra che non stia prestando affatto attenzione alle istruzioni. Suggerimenti?
Qualcun altro ha avuto esperienze positive o negative con il rilevamento spam dell’IA?