有害な言葉遣いを避けるようユーザーに促す

awesomerobot · 2021 年 5 月 6 日午後 5:41

Discourse Google Perspective API で実験を行いましたが、あなたがリンクされた記事で説明されているのと同様の問題に直面しました。微妙なニュアンスのある言語処理に苦しみ、非差別的な表現を差別的と誤って検出してしまうことがありました。こうした誤検出（フォールス・ポジティブ）自体が差別的な結果を招くこともあります！

しかし、Twitter の初期テストではいくつかの問題が発生しました。システムやアルゴリズムが多くの会話に見られるニュアンスを十分に理解できず、差別的な返信と皮肉、あるいは時には友好的な軽口との区別がつかないことがありました。また、少数派コミュニティが差別的な表現を再定義し、害のない文脈で使用するケースへの対応も難しかったです。

トピック		返信	表示
Pre-emptively warning a contributor about the toxicity of their post Feature	18	3582	2017 年 9 月 27 日
Auto-checking quality of language in posts? Feature	2	1027	2017 年 10 月 26 日
Evaluating Google's Perspective API on your Discourse forum Development	12	3892	2018 年 2 月 12 日
Have AI check for inappropriate post or at least words and flag the post Support ai , ai-toxicity	2	491	2023 年 7 月 7 日
How to Get Notified of Offensive Language in Personal Messages to Issue Warnings? Support	3	171	2024 年 12 月 1 日

有害な言葉遣いを避けるようユーザーに促す

関連トピック