Ao usar Palavras Observadas, caracteres acentuados podem causar falsos positivos ao dividir uma palavra no caractere acentuado em vez de tratá-la como parte da palavra. Parece que o filtro de palavras trata letras com acentos e diacríticos como espaços em branco em vez de parte da mesma palavra.
Passos para reproduzir:
Adicione ‘anal’ às Palavras Observadas bloqueadas
Como usuário não administrador, tente usar analógico em uma postagem
A postagem é bloqueada
Tentar o mesmo com analog funciona como esperado e tem permissão para ser postado.
9 curtidas
nizar9
Abril 24, 2023, 7:43pm
3
Consegui reproduzir a mesma coisa aqui. Esse bug também inclui outros caracteres com cedilha como ç e ş:
3 curtidas
nbianca
(Bianca)
Maio 18, 2023, 3:06pm
10
O suporte para caracteres UTF-8 em palavras monitoradas foi implementado neste PR:
main ← fix_utf8
opened 07:17PM - 02 May 23 UTC
Watched words were converted to regular expressions containing \W, which handled… only ASCII characters. Using [^[:word]] instead ensures that UTF-8 characters are also handled correctly.
Isso deve detectar corretamente os limites das palavras para todas as palavras, incluindo aquelas que contêm caracteres UTF-8.
3 curtidas
nbianca
(Bianca)
Fechado
Maio 22, 2023, 5:00am
11
Este tópico foi fechado automaticamente após 3 dias. Novas respostas não são mais permitidas.