Aumentar el límite máximo de palabras observadas

Me veo potencialmente alcanzando este límite al usar palabras observadas para combatir el spam repetitivo, y tuve algunas ideas sobre lo que podría ser útil en el futuro para otros, si no para el OP.

Una forma de lidiar con esto sin ningún cambio de código es cambiar a Using Regex with Watched Words y combinar muchas palabras en una sola expresión regular. Es fácil equivocarse si no estás familiarizado con las expresiones regulares, pero es técnicamente factible. (Esta es la dirección que probablemente tomaré, porque conozco las expresiones regulares).

Además, esperaría que haya dos formas de escribir un plugin aquí.

La razón del límite de 2000 es que el algoritmo no escala muy bien y se ejecuta de forma síncrona, pero es un límite arbitrario. Esperaría que un plugin simple pudiera parchear el límite de 2000 palabras para aceptar la penalización de rendimiento. ¡Pero yo mismo no haría eso para 10000 entradas!

El otro enfoque, posiblemente complementario, sería tener una lista separada específicamente para marcar, y hacerlo de forma asíncrona desde un trabajo de sidekiq que se activa para cada creación/edición de publicación.

1 me gusta