Ich bin promovierter Forscher im Bereich Machine Learning und denke darüber nach, ein Tool zu entwickeln, mit dem jeder ein benutzerdefiniertes KI-System trainieren kann, um bei der Inhaltsmoderation auf Discourse-Foren zu helfen. Wäre das etwas für die Leute hier?
Ich weiß, dass es die Google Perspective API gibt, aber sie ist sehr allgemein gehalten. Meine Idee ist ein Plugin, mit dem ihr Beiträge moderieren könnt, und das automatisch einen Textklassifizierer trainiert, der aus eurer Moderation lernt. Wenn ihr beispielsweise einen Beitrag als toxisch oder themenfremd markiert, lernt das System daraus und kann ähnliche Beiträge kennzeichnen oder sogar vor der Veröffentlichung moderieren.
Das wäre auch schön: entweder das eine oder die automatische Kategorisierung von nicht kategorisierten Themen basierend auf einem benutzerdefinierten, trainierten Modell.
Textklassifizierer (die beispielsweise in Foren verwendet werden) gibt es schon seit langem.
In der Regel wird diese Art der Textklassifizierung und -bewertung mit bayesschen Klassifikatoren durchgeführt.
Wenn du eine Google-Suche mit den folgenden Stichworten durchführst:
bayesian classifier ruby
und/oder
bayesian classifier javascript
findest du eine Vielzahl an Bibliotheken und Beispielen für Textklassifizierung mit bayesschen Klassifikatoren.
Wir haben im Laufe der Jahre verschiedene bayessche Klassifikatoren für die Moderation von Forenbeiträgen, Spam-Erkennung und mehr eingesetzt und haben benutzerdefinierten Code implementiert, um den Klassifikator zu trainieren, wenn Moderatoren Moderationsaktionen durchführen.
Ein potenzielles Problem dabei ist, dass viele Moderationsaufgaben keine einfache Bestrafung darstellen, sondern komplexer sind, wie etwa „das Thema für 12 Stunden schließen