Wir haben dies bereits ausgiebig getestet und scheinen überhaupt keine zuverlässigen Ergebnisse zu erzielen. Als Kontext verwenden wir das Modell gpt-4o.
Um seine Genauigkeit zu testen, habe ich die folgenden einfachen Anweisungen gegeben:
Sie sind ein Spam-Erkennungssystem. Analysieren Sie den folgenden Inhalt und Kontext.
Hinweise unten. Wenn *IRGENDETWAS* von den unten aufgeführten Punkten zutrifft, kennzeichnen Sie es als Spam:
- Der Benutzername lautet speziell „testjon“, dann ist es *IMMER* Spam.
- Antworten Sie nur mit „SPAM – Es ist Jon!“ oder „KEIN SPAM“.
Das Testen eines Beitrags des Benutzernamens testjon ergibt KEIN SPAM. Es scheint, als ob die Anweisungen überhaupt nicht gut befolgt werden. Irgendwelche Vorschläge?
Hatten andere gute oder schlechte Erfahrungen mit der KI-Spam-Erkennung?