インターネット上での重複に関するスタッフ通知を自動的に追加しますか?

Akismet スパムフィルターは、Docker フォーラムと、たとえば Stack Exchange サイト(主に Stack Overflow)、GitHub、Reddit との間で重複する投稿を見つけるのに非常に優れています。これらの投稿はレビューに入りますが、Akismet が一致する投稿を見つけた場所を示しません。


Akismet がこの投稿をスパムの可能性ありとしてフラグ付けしました。

Akismet プラグインを、他の発生元の URL を表示するように構成できるかどうかを尋ねたかったのです。しかし、実際には、もっと多くのことを望んでいます。

多くの場合、テキストの一部を Google にコピー&ペーストするだけで、結局はソースが見つかります。そして Docker フォーラムでは、フラグを却下(重複投稿を承認)し、回答しているボランティアのためにスタッフ通知を追加する傾向があります。このようになります


:warning: これは Stack Overflow にも投稿されました。回答に時間を費やす場合は、新しい詳細が追加されたか、または誰かがすでにそこで回答したかを確認することをお勧めします。

それで、疑問に思っています。誰かが同様のことを自動化しようとしたことはありますか?

補足:

  • Stack Overflow にもフォーラムへのリンクを投稿する傾向があります。それは anyway 手動のアクションです。したがって、自動化された場合、いずれにしても通知したい場合があります。
  • Akismet によって重複として検出されない(またはマークされない)(まだ)「新規ユーザーが最初の投稿を異常に速く入力し、ボットまたはスパマーの行動が疑われる」場合にも、同じアプローチをよく使用します。
「いいね!」 4

@Arjanさん、こんにちは。:wave:

Akismetがオンライン上の重複コピーをフィルタリングするとは知りませんでした。おそらく、それらの例で使用されている特定のマークアップが含まれていたことがAkismetをトリガーしたのでしょう。

Akismetがそのサービスを提供しているという言及が見つかりません。ガイダンスを提供していただけますか?その情報がサービスを通じて利用可能であれば、それにアクセスできるかもしれません。:slight_smile:

「いいね!」 2

うーん、あなたは正しいかもしれません。私はStack ExchangeもAkismetを使用していると大胆に仮定しました(実際には知りませんが)。レビューが既存の投稿に対してもトリガーされたのを見たように思いますが、例を見つける必要があります。ほとんどの場合、Stack Exchangeの投稿の方が古かったため、「最初の投稿を疑わしいほど速く入力した」というレビューがコピー&ペーストによってトリガーされたことも説明できます。

また、しばらくの間、投稿が編集された後に多くの誤検知が見られました。これにより、フィルターが重複を見つけるための独自のアルゴリズムに混乱し、オンラインデータベースからの重複が同じフォーラムの同じ投稿であることを理解していないと仮定しました。この原因を検索したとき、Akismetのサービスに参照を見つけることができませんでした。

したがって、多くの仮定があります。例を見つけようとしますが、フォーラムと他の場所の間でさらに多くの投稿が重複している可能性があり、結局のところ、それらのうちのいくつかは見つけられなかっただけかもしれません。:thinking:

Stack Exchange には独自のソリューションがあるようです。少なくとも 2 年前まではそうでした: How does spam protection work on Stack Exchange? - Stack Overflow

もちろん、Akismet は Stack Exchange の公開フィードを購読し続けることもできますが、重複を見つけることは彼らの目標ではありません。(あるいは、Akismet がフラグを立てた Stack Exchange の重複が、他の場所でも重複していたのかもしれません。まあ、いいでしょう。)

「いいね!」 1

@maiki 確認できるような例には遭遇していません。確かにAkismetはしばらくしてから既存の投稿をスパムとしてフラグ付けしましたが、その内部については何もわかりません。

「いいね!」 1