Gesehene Worttricks

RGJ · 5. Juni 2020 um 08:34

Beim Umwandeln einer großen Liste beobachteter Wörter in reguläre Ausdrücke habe ich einige Möglichkeiten gefunden, die Filter zu umgehen. Diese scheinen sowohl für „normale

codinghorror · 5. Juni 2020 um 21:39

Richtig, das ist im Allgemeinen eine Art von Dingen, bei denen wir uns nicht die Zeit nehmen, zu streiten, denn es gibt viele ‘clevere’ Tricks, um jede Art von Wortblockliste zu umgehen. Unicode ist ein sehr, sehr großer Raum.

Stephen · 5. Juni 2020 um 21:57

Tatsächlich haben wir dies vor einiger Zeit bei einer Reihe riesiger Bildungsprojekte ausprobiert.

Bevor es aufgegeben wurde, ging man mit einer unscharfen Übereinstimmung (fuzzy matching) live, was vorhersehbar alle möglichen Probleme für legitime Anwendungsfälle verursachte.

riking · 5. Juni 2020 um 23:22

Gesperrte Wörter dienen hauptsächlich als ‘erste Verteidigungslinie’ gegen unangemessene Wörter. Dennoch ist die Gemeinschaft notwendig, um Umgehungen und Verstöße zu melden.

Keine von dir entwickelte Regex wird in der Lage sein, ein zu erkennen.

elijah · 6. Juni 2020 um 06:52

Nur zur Info: [] steht für „Zeichenklassen“. In Perl-regulären Ausdrücken und möglicherweise auch in Ruby-Ausdrücken ist \b außerhalb einer Zeichenklasse eine „Wortgrenze“ und innerhalb einer Zeichenklasse ein „Rücklöschzeichen“ (Backspace). In C ist \b immer ein Rücklöschzeichen (genauer gesagt ). Rücklöschzeichen sind die meiste Zeit nicht nützlich, während Wortgrenzen es sind – daher die Neudefinition.

Um einen regulären Ausdruck zu verwenden, der entweder „forbidden“ oder „forbidden“ erkennt, würde ich wahrscheinlich Folgendes verwenden:

\b_?forbidden_?\b

(Ich weiß auch, wie man alle Buchstaben mit XX; kodiert, um Unicode-Tricks oder den regulären Ausdruck zu umgehen.)

RGJ · 6. Juni 2020 um 07:27

Mir war nie bewusst, dass es je nach Kontext einen Unterschied gibt. Vielen Dank für die Erklärung!

Thema		Antworten	Aufrufe
Watched Words - Is there a way to block the use of asterisks with certain words instead of it being used as a wildcard? Support watched-words	12	242	16. August 2024
* wildcards in Watched Words (Censor) don't work Feature	19	3264	11. Januar 2018
Using Regex with Watched Words Site Management reference , regex , watched-words , content	1	1964	14. Juni 2024
Watched words regex: word boundary not working as expected Bug	4	1467	24. Januar 2018
Hope Watched words adds support for non-English characters Bug	1	87	16. Februar 2026

Gesehene Worttricks

Verwandte Themen