Wirklich? Nicht einmal Open AI behauptet, dass dies getan werden kann.
Guter Punkt, das wurde nur als eine mögliche Option vorgeschlagen. Seit diesem Blogbeitrag gab es bessere Modelle wie GPT4-Turbo und Claude 3, die theoretisch auf eine bessere Leistung hindeuten könnten.
Dies war kein Seitenhieb auf den Gesamtansatz hier.
Die Verwendung eines LLM, um nach Merkmalen im Text zu suchen, die auf Spam hindeuten könnten, ist ein wirklich großartiges Ziel, und ich begrüße die Ergänzung von ganzem Herzen.
Mein einziges Problem war die Behauptung, dass KI-generierter Text automatisch identifiziert werden kann, was ein sehr schwieriges Problem ist.
Beachten Sie den Unterschied:
- Ist die Identifizierung von allgemeinem Spam mit LLM = großartig und ich kann sehen, wie dies handhabbar und sehr lohnenswert sein könnte
- Ist die Identifizierung, dass der Spam von KI generiert wurde – mit oder ohne Verwendung eines LLM ist dies schwierig. Ich glaube nicht, dass aktuelle Modelle dies speziell gut können, und positive Ergebnisse sind wahrscheinlich nur Halluzinationen.
Ich verstehe dich! Ja, das ist ein viel nuancierteres Problem. Tatsächlich habe ich in meinen ursprünglichen Tests versucht, es für beides einzurichten, aber die Konzentration nur auf Spam liefert hier wahrscheinlich bessere Ergebnisse.
Wir sind uns also einig.
Ich denke zwar, dass es einige verräterische Anzeichen für KI gibt – wie die Länge von Beiträgen und die übermäßige Verwendung von außergewöhnlich blumiger Sprache … vielleicht können diese Aspekte analysiert werden … Die Länge von Beiträgen ist für ein LLM wahrscheinlich schwer zu handhaben, aber „Blumigkeit“ ist vielleicht weniger schwierig. Sie können natürlich deterministische Funktionen für die Kennzeichnung der Beitragslänge verwenden.
Andererseits ist es wahrscheinlich nicht hilfreich für die allgemeine Einbeziehung in die Community, wenn jemand ChatGPT verwendet hat, um z. B. sein Englisch (als Zweitsprache) zu verfeinern, und dann seinen Beitrag kennzeichnet.
Wenn man hier noch einen Schritt weiter geht, könnten allgemeine Techniken des maschinellen Lernens nützlich sein, aber komplexer zu implementieren sein, als nur Text an ein LLM zu senden und das Ergebnis zu erhalten.