Discourse Google Perspective API で実験を行いましたが、あなたがリンクされた記事で説明されているのと同様の問題に直面しました。微妙なニュアンスのある言語処理に苦しみ、非差別的な表現を差別的と誤って検出してしまうことがありました。こうした誤検出(フォールス・ポジティブ)自体が差別的な結果を招くこともあります!
しかし、Twitter の初期テストではいくつかの問題が発生しました。システムやアルゴリズムが多くの会話に見られるニュアンスを十分に理解できず、差別的な返信と皮肉、あるいは時には友好的な軽口との区別がつかないことがありました。また、少数派コミュニティが差別的な表現を再定義し、害のない文脈で使用するケースへの対応も難しかったです。