Le filtre anti-spam Akismet est assez bon pour trouver des doublons entre le forum Docker et, disons, les sites Stack Exchange (principalement Stack Overflow), GitHub et Reddit. Ces publications finissent en revue, mais ne révèlent pas où Akismet a pu trouver la publication correspondante :
Akismet a signalé cette publication comme spam potentiel.
Je suppose que je voulais demander si le plugin Akismet pouvait être configuré pour afficher les URL d’autres occurrences. Mais en fait, je veux plus…
Souvent, copier/coller une partie du texte dans Google révèle la source après tout. Et sur les forums Docker, j’ai tendance à rejeter le drapeau (approuver la publication en double) mais aussi à ajouter une note du personnel pour les bénévoles qui répondent aux questions. Comme ceci :
Alors, je me demande : quelqu’un a-t-il déjà essayé d’automatiser quelque chose de similaire ?
Par ailleurs :
J’ai aussi tendance à poster un lien vers le forum sur Stack Overflow ; c’est une action manuelle de toute façon. Donc, si c’est automatisé, on pourrait vouloir être informé de toute façon.
J’utilise assez souvent la même approche pour « Un nouvel utilisateur a tapé son premier message très rapidement, comportement suspect de bot ou de spammeur » qui n’est pas détecté (ou marqué) comme un doublon par Akismet (pour l’instant).
Je ne savais pas qu’Akismet filtrais les copies en double en ligne ; je suppose que c’est l’inclusion de certaines balises utilisées dans ces exemples qui a déclenché Akismet.
Je ne trouve aucune mention d’Akismet fournissant ce service, pourriez-vous me guider ? Si cette information est disponible via leur service, peut-être pourrions-nous l’exploiter.
Hmmm, tu as peut-être raison. J’ai osé supposer que Stack Exchange utilisait également Akismet (ce que je ne sais pas en fait). Je pense, mais je devrai trouver des exemples, que j’ai également vu l’examen être déclenché pour des publications existantes, après qu’elles aient été dupliquées sur Stack Exchange. Le plus souvent, il semble que la publication Stack Exchange était plus ancienne, ce qui explique également que le copier-coller déclenche l’examen “a tapé sa première publication de manière suspecte” .
De plus, pendant un certain temps, nous avons certainement vu de nombreux faux positifs après la modification des publications. Cela m’a fait supposer que le filtre était confus par son propre algorithme pour trouver des doublons, ne comprenant pas que le doublon d’une base de données en ligne était la même publication sur le même forum. En cherchant la cause de cela, je n’ai trouvé aucune référence dans les services d’Akismet.
Donc, beaucoup d’hypothèses. J’essaierai de trouver quelques exemples, mais peut-être que encore plus de publications sont dupliquées entre le forum et d’autres endroits, et peut-être que je n’en ai trouvé que quelques-unes après tout.
Bien sûr, Akismet pourrait toujours s’abonner au flux public des publications de Stack Exchange, mais ce n’est pas leur objectif de trouver des doublons. (Ou peut-être que les doublons de Stack Exchange qu’Akismet a signalés étaient également dupliqués ailleurs. Tant pis.)
@maiki Je n’ai pas rencontré d’exemples pour confirmer que cela semblait s’être produit. Certes, Akismet a signalé des publications existantes comme spam après un certain temps, mais je n’ai aucune idée de son fonctionnement interne pour le déterminer.