Script de escaneo de cuentas spam

Para empezar, debo decir que no soy un gran programador. Esta es la primera herramienta “real” que he escrito que (potencialmente) es útil para personas distintas a mí. Me encantaría recibir cualquier comentario o crítica que tengas.

He escrito un script en Python que recorre la lista de usuarios sospechosos y/o silenciados y te permite eliminarlos si es necesario. Lo ejecuté en Discourse de Mozilla y eliminé varias docenas de cuentas; esto fue solo después de haber eliminado manualmente cerca de un centenar.

Hay algunas cosas que parecen bastante chapuceras, especialmente las líneas 174 a 191. Como dije, agradecería cualquier comentario que puedas tener y estaré encantado de responder a cualquier pregunta.

11 Me gusta

¡Muy genial! Una cosa que querrás hacer es asegurarte de que Akismet esté activado, ya que recientemente (en los últimos 2-3 meses) agregamos una función donde el plugin de Akismet escanea las nuevas cuentas de usuario en busca de contenido spam y las marca para ti, gracias a @Roman :clap:

Sí, registros de cuentas spam completamente humanos —cuentas que nunca publican, solo crean un perfil con información y desaparecen para siempre— sigue siendo un problema. Lo siguiente es incluso después de la verificación de Akismet:

Pero ten en cuenta que los perfiles de usuario no se indexan en absoluto, y la información de los nuevos perfiles está muy restringida… y nuestro cambio en Akismet ayuda enormemente.

¡Sin embargo, todavía se necesita una herramienta de limpieza!

7 Me gusta

¡No lo sabía! Tendré que hablar con @LeoMcA para ver si queremos activarlo.

4 Me gusta

Los usuarios sospechosos ahora se envían a la Cola de Revisión, lo que eliminó la lista de usuarios sospechosos que utilizaba este script. Al estar siendo derivados a una revisión manual, ¿es esto necesario ahora?

3 Me gusta

¿Ha habido algún progreso en esto?

Nuestra comunidad está experimentando varias inscripciones de cuentas de spam/bots por día que tienen 0 publicaciones leídas, 0 temas vistos, menos de 1 minuto de tiempo de lectura. Sería bueno tener una función de eliminación automática para todas las cuentas con ciertos parámetros seleccionados.

Además, ¿existe la opción de un plugin Captcha o similar para ayudar a filtrar bots?

Si esas cuentas no tienen actividad, son inofensivas. Son invisibles para otros usuarios (incluida una lista pública de usuarios). Y los perfiles de usuario, independientemente de su nivel de confianza, están prohibidos en robots.txt y no son visibles en los motores de búsqueda.

Además, las cuentas inactivas se limpian periódicamente, consulta la configuración Limpiar usuarios inactivos después de días (“Número de días antes de que se elimine un usuario inactivo (nivel de confianza 0 sin publicaciones). Para deshabilitar la limpieza, establécelo en 0”).

Es activado por el trabajo SideKiq CleanUpInactiveUsers.

1 me gusta

Eso no prohíbe nada. robots.txt es solo una sugerencia educada, que al mismo tiempo apunta en la dirección correcta.

Puede que sea inofensivo, pero en el pasado los spammers han utilizado estas cuentas para “envejecer” sus perfiles antes de activarlos, sabiendo que vigilamos las cuentas nuevas. Luego, de repente, una cuenta de hace 3 meses intenta enlazar con cualquier intento de spam o phishing de usuarios.

Personalmente, me gustaría tener mejores herramientas para evitar que se conviertan en un problema en lugar de esperar. También sería útil si tuviéramos herramientas más sólidas para evitar que los bots se registren en primer lugar.

Claro, todavía puede ser un problema a veces. Experimento mucho spam, pero hasta ahora no he visto que cuentas de spam publiquen de repente después de mucho tiempo.

Si publicaran spam, de todos modos serían rápidamente marcadas por otros usuarios.

Y aún puedes reducir drásticamente la duración después de la cual se elimina una cuenta inactiva.