El filtro de spam Akismet es bastante bueno para encontrar publicaciones duplicadas entre el foro de Docker y, por ejemplo, sitios de Stack Exchange (principalmente Stack Overflow), GitHub y Reddit. Estas publicaciones terminan en revisión, pero luego no revelan dónde Akismet pudo haber encontrado la publicación coincidente:
Akismet marcó esta publicación como spam potencial.
Supongo que quería preguntar si el plugin Akismet podría configurarse para mostrar las URL de otras ocurrencias. Pero en realidad, quiero más…
A menudo, simplemente copiar y pegar parte del texto en Google revela la fuente después de todo. Y en los foros de Docker, tiendo a rechazar la marca (aprobar la publicación duplicada) pero también agrego una notificación del personal para los voluntarios que responden preguntas. Así es como:
Entonces, me pregunto: ¿alguien ha intentado automatizar algo similar?
Aparte:
También tiendo a publicar un enlace de regreso al foro en Stack Overflow; eso es una acción manual de todos modos. Por lo tanto, si se automatiza, es posible que se desee recibir una notificación de todos modos.
Con bastante frecuencia utilizo el mismo enfoque para “Un nuevo usuario escribió su primera publicación sospechosamente rápido, comportamiento sospechoso de bot o spammer” que no es detectado (o marcado) como duplicado por Akismet (todavía).
No sabía que Akismet filtraba copias duplicadas en línea; supongo que fue la inclusión de ciertas marcas utilizadas en esos ejemplos lo que activó Akismet.
No encuentro mención de que Akismet ofrezca ese servicio, ¿podrías orientarme? Si esa información está disponible a través de su servicio, tal vez podamos aprovecharla.
Hmmm, puede que tengas razón. Asumí audazmente que Stack Exchange también estaba usando Akismet (lo cual en realidad no sé). Creo, pero necesitaré encontrar ejemplos, que también vi que la revisión se activaba para publicaciones existentes, después de que se duplicaba en Stack Exchange. La mayoría de las veces, parece que la publicación de Stack Exchange era más antigua, lo que también explica que el copiado y pegado activara la revisión de “escribió su primera publicación sospechosamente rápido”.
Además, durante algún tiempo, seguramente vimos muchos falsos positivos después de que se editaran las publicaciones. Esto me hizo suponer que el filtro estaba confundido por su propio algoritmo para encontrar duplicados, sin entender que el duplicado de alguna base de datos en línea era la misma publicación en el mismo foro. Al buscar la causa de esto, no encontré ninguna referencia en los servicios de Akismet.
Entonces, muchas suposiciones. Intentaré encontrar algunos ejemplos, pero tal vez incluso más publicaciones se dupliquen entre el foro y otros lugares, y tal vez solo haya encontrado algunas de ellas después de todo.
Por supuesto, Akismet podría seguir suscribiéndose al feed público de las publicaciones de Stack Exchange, pero no es su objetivo encontrar duplicados. (O tal vez los duplicados de Stack Exchange que Akismet marcó también estaban duplicados en otros lugares. Bueno.)
@maiki No me he encontrado con ejemplos que confirmen que esto pareció haber sucedido. Ciertamente Akismet marcó publicaciones existentes como spam después de que pasara algún tiempo, pero no tengo idea de su funcionamiento interno para determinarlo.