Caracteres acentuados causam falsos positivos em Palavras Observadas

Ao usar Palavras Observadas, caracteres acentuados podem causar falsos positivos ao dividir uma palavra no caractere acentuado em vez de tratá-la como parte da palavra. Parece que o filtro de palavras trata letras com acentos e diacríticos como espaços em branco em vez de parte da mesma palavra.

Passos para reproduzir:

  • Adicione ‘anal’ às Palavras Observadas bloqueadas
  • Como usuário não administrador, tente usar analógico em uma postagem

  • A postagem é bloqueada

Tentar o mesmo com analog funciona como esperado e tem permissão para ser postado.

9 curtidas

Consegui reproduzir a mesma coisa aqui. Esse bug também inclui outros caracteres com cedilha como ç e ş:

3 curtidas

O suporte para caracteres UTF-8 em palavras monitoradas foi implementado neste PR:

Isso deve detectar corretamente os limites das palavras para todas as palavras, incluindo aquelas que contêm caracteres UTF-8.

3 curtidas

Este tópico foi fechado automaticamente após 3 dias. Novas respostas não são mais permitidas.