Aggiungere automaticamente un avviso allo staff in caso di duplicato su Internet?

Il filtro antispam Akismet è abbastanza bravo a trovare post duplicati tra il forum Docker e, ad esempio, i siti Stack Exchange (principalmente Stack Overflow), GitHub e Reddit. Questi post finiscono in revisione, ma poi non rivelano dove Akismet potrebbe aver trovato il post corrispondente:


Akismet ha contrassegnato questo post come potenziale spam.

Suppongo di voler chiedere se il plugin Akismet potesse essere configurato per mostrare gli URL di altre occorrenze. Ma in realtà, voglio di più…

Spesso basta copiare e incollare parte del testo su Google per rivelare la fonte. E sui forum Docker tendo poi a rifiutare il flag (approvare il post duplicato) ma aggiungo anche un avviso dello staff per i volontari che rispondono alle domande. Come questo:


:warning: Questo è stato pubblicato anche su Stack Overflow. Se vuoi dedicare tempo a rispondere, potresti verificare se sono stati aggiunti nuovi dettagli o se qualcuno ha già risposto lì.

Quindi, mi chiedo: qualcuno ha mai provato ad automatizzare qualcosa di simile?

A latere:

  • Tendo anche a pubblicare un link al forum su Stack Overflow; questa è comunque un’azione manuale. Quindi, se fosse automatizzato, si potrebbe voler essere avvisati comunque.

  • Utilizzo abbastanza spesso lo stesso approccio per “Nuovo utente ha digitato il suo primo post sospettosamente velocemente, comportamento sospetto di bot o spammer” che non viene rilevato (o contrassegnato) come duplicato da Akismet (ancora).

4 Mi Piace

Ciao @Arjan. :wave:

Non sapevo che Akismet filtrasse per copie duplicate online; immagino sia stata l’inclusione di determinati markup utilizzati in quegli esempi ad aver attivato Akismet.

Non riesco a trovare menzione di Akismet che fornisca tale servizio, potresti fornire delle indicazioni? Se tali informazioni sono disponibili tramite il loro servizio, forse possiamo sfruttarle. :slight_smile:

2 Mi Piace

Hmmm, potresti avere ragione. Ho osato supporre che Stack Exchange stesse utilizzando anche Akismet (cosa che in realtà non so). Penso, ma dovrò trovare degli esempi, di aver visto anche la revisione attivarsi per post esistenti, dopo che era stato duplicato su Stack Exchange. Il più delle volte sembra che il post di Stack Exchange fosse più vecchio, il che spiega anche perché il copia-incolla abbia attivato la revisione “hanno digitato il loro primo post sospettosamente velocemente”.

Inoltre, per un po’ di tempo, abbiamo sicuramente visto molti falsi positivi dopo che i post venivano modificati. Questo mi ha fatto supporre che il filtro fosse confuso dal suo stesso algoritmo per trovare duplicati, non comprendendo che il duplicato da un qualche database online fosse lo stesso post sullo stesso forum. Cercando la causa di ciò, non ho trovato alcun riferimento nei servizi di Akismet.

Quindi, molte supposizioni. Cercherò di trovare alcuni esempi, ma forse anche altri post sono duplicati tra il forum e altri luoghi, e forse ne ho trovati solo pochi, dopotutto. :thinking:

Sembra che Stack Exchange abbia la propria soluzione interna, almeno ne aveva 2 anni fa: How does spam protection work on Stack Exchange? - Stack Overflow

Naturalmente, Akismet potrebbe ancora iscriversi al feed pubblico dei post di Stack Exchange, ma non è loro obiettivo trovare duplicati. (O forse i duplicati di Stack Exchange che Akismet ha segnalato erano anche duplicati altrove. Vabbè.)

1 Mi Piace

@maiki Non ho riscontrato esempi per confermare che ciò sia accaduto. Sicuramente Akismet ha segnalato post esistenti come spam dopo che è passato del tempo, ma non ho idea dei suoi meccanismi interni per determinarlo.

1 Mi Piace