ウォッチワードとワンボックス

ワンボックスの内容が監視単語フィルターを通過していないようです。

当フォーラムでは、複数のユーザーが以下の漫画へのリンクを投稿しています。漫画自体は問題ありませんが、代替テキストに卑語が含まれています。ワンボックスはこの代替テキストを取得して表示しますが、監視単語機能によって検出されません。監視単語フィルターは、ワンボックスから取得されたテキストもチェックすべきだと思われます。

「いいね!」 3

これは興味深いエッジケースだとは同意しますが、どこまで掘り下げるべきでしょうか。画像に卑猥な言葉が含まれている可能性もあります。

このようなケースでは、単にフラグ付けに頼る方が理にかなっているかもしれません。

「いいね!」 4

これはエッジケースであることに同意します。私の仮定では、ワンボックステキストを取得して監視ワードチェックを実行するのは難しくないはずでしたが、画像に対する OCR を実行するのは現実的ではないと考えました。

この独特の境界ケースに対するもう一つの簡単なアプローチは、テンプレートに最小限の JavaScript を追加することで、この HTML IMG 要素(またはこれらの要素)の title 属性を単純にフィルタリングまたは削除することです。

IMG HTML 要素の title 属性をフィルタリングする際に厳格な境界ケース要件を持つサイトにとっては、簡単な JS フィルタの実装の方が、私は容易だと考えます。

(元のウェブサイトからの画像)

@sciencewhiz さん、参考になれば幸いです。

「いいね!」 1