Osservato miglioramento delle parole -- caratteri Unicode dall'aspetto simile

markersocial · 5 Agosto 2019, 3:00am

Per le parole monitorate, penso che si potrebbe migliorare il sistema facendo corrispondere anche i caratteri Unicode simili.

Ad esempio:
abcabcabc
𝘢𝘣𝘤𝘢𝘣𝘤𝘢𝘣𝘤
𝒂𝒃𝒄𝒂𝒃𝒄𝒂𝒃𝒄
ab𝘤𝘢𝘣𝒄𝒂𝒃𝒄

Questo permetterebbe essenzialmente agli spammer di creare molte varianti delle stesse parole per aggirare il filtro delle parole. Sono stato bombardato da spammer astuti e motivati, che hanno messo alla prova le funzionalità anti-spam di Discourse fino al limite assoluto. Questa è una delle tecniche che stanno utilizzando.

Forse potrebbe essere utile: GitHub - janlelis/unicode-confusable: Unicode::Confusable.confusable? "ℜսᖯʏ", "Ruby" · GitHub

codinghorror · 5 Agosto 2019, 3:07am

Quello non è un “font”, è un diverso insieme di caratteri Unicode.

markersocial · 5 Agosto 2019, 3:17am

Ah, scusa, grazie per la correzione. Ho aggiornato il post.

codinghorror · 5 Agosto 2019, 4:00am

Improbabile, poiché quel tipo di corrispondenza unicode che “sembra simile” è estremamente costoso in termini di tempo di CPU ed è anche molto delicato da implementare correttamente, perché chi decide cosa “sembra simile” a qualcos’altro?

Ti suggerisco di considerare altri metodi per gestire questi spammer.

Nel frattempo, aggiungi semplicemente le varianti comuni dei termini di spam necessarie in diversi caratteri unicode.

Argomento		Risposte	Visualizzazioni
Bypassing watched words with confusable character replacements Support watched-words	2	232	Dicembre 17, 2024
Russian characters in Watched Words list are failing to be properly identified Bug watched-words	1	555	Febbraio 10, 2021
Watched words to block recent spam attack Sysadmins watched-words , spam	12	416	Settembre 10, 2025
Hope Watched words adds support for non-English characters Bug	1	89	Febbraio 16, 2026
Accented characters cause false postives in Watched Words Bug watched-words	2	490	Maggio 18, 2023

Osservato miglioramento delle parole -- caratteri Unicode dall'aspetto simile

Argomenti correlati