Moeten we de AI spamscanner standaard berichten laten markeren die telefoonnummers bevatten?

awesomerobot · 15 september 2025 om 14:40

Het lijkt erop dat een vrij veelvoorkomende vorm van spam ongerelateerde klantenserviceberichten zijn, waarschijnlijk in een poging om valse informatie te laten verschijnen in AI- of zoekresultaten? Deze bevatten vaak telefoonnummers… moeten we telefoonnummers vermelden in onze AI-spam prompt? Waarschijnlijk ongebruikelijk voor mensen om deze in normale gebruiksscenario’s te plaatsen?

Bestaande standaard prompt

Je bent een spamdetectiesysteem. Analyseer de volgende postinhoud en context.

Overweeg het posttype zorgvuldig:
- Voor ANTWOORD-posts: Controleer of het antwoord relevant en actueel is voor de thread
- Voor NIEUW ONDERWERP-posts: Controleer of het een legitiem onderwerp of spam-promotie is

Een post is spam als deze voldoet aan een van de volgende criteria:
- Bevat ongevraagde commerciële inhoud of promoties
- Heeft verdachte of ongerelateerde externe links
- Vertoont patronen van geautomatiseerde/bot-posts
- Bevat irrelevante inhoud of advertenties
- Voor antwoorden: Volledig ongerelateerd aan het discussieforum
- Gebruikt te veel trefwoorden of repetitieve tekstpatronen
- Vertoont verdachte opmaak of karaktergebruik

Wees vooral streng met:
- Antwoorden die de vorige conversatie negeren
- Posts met meerdere ongerelateerde externe links
- Algemene antwoorden die overal geplaatst kunnen worden

Wees eerlijk tegen:
- Nieuwe gebruikers die legitieme eerste bijdragen leveren
- Niet-moedertaalsprekers die oprechte pogingen doen om deel te nemen
- Productvermeldingen die relevant zijn voor het onderwerp in passende contexten

Site-specifieke informatie:
- Sitetitel: {site_title}
- Site URL: {site_url}
- Sitedescriptie: {site_description}
- Top 10 sitecategorieën: {top_categories}

Format je antwoord als een JSON-object met één sleutel genaamd "spam", wat een boolean aangeeft of een post spam of legitiem is.
Je output moet in het volgende formaat zijn:

{"spam": xx}

Waar xx waar is als de post spam is, of onwaar als deze legitiem is.
reageer alleen met geldige JSON

pfaffman · 15 september 2025 om 15:53

En ik denk dat die telefoonnummers vaak verschillende versluieringen van telefoonnummers bevatten om telefoontest-regex’en te omzeilen (ik weet het niet echt, zoals, uh, unicode of iets anders onzin?). Is er een manier om de AI specifiek te laten zoeken naar die?

awesomerobot · 15 september 2025 om 16:06

We can do some testing based on spam we’ve received, but I suspect prompting it to look out for phone numbers and specifying that it should pay attention to possible unicode obscurification attempts may be good enough to catch most of it?

I’d guess it would be better at catching attempts to hide numbers than regex would be just because it’s more flexible.

pfaffman · 15 september 2025 om 16:42

Coming from someone who knows little about AI and not a lot about unicode (relative to the group that I hope is paying attention to this), that sounds great!

I would think so. Given that the AI can identify Unicode reliably, there is zero reason for a phone number to contain Unicode, so it should be pretty easy. Back in the days of simple Bayesian classification, a Unicode phone number would be a very good Spam indicator. A bunch of them also had some weird unicode TM symbol and a couple others.

And if it could reliably look for stuff like “customer support” at a company that’s not connected to the forum, that would also be some low hanging fruit.

sam · 15 september 2025 om 23:23

A lot of this depends on “we need evals”:

We have:

https://github.com/discourse/discourse-ai-evals

What we need to do here is:

Add a big bunch of spam/ham posts to the eval suite (say 20-30 or each)
Run the eval
Fix the prompt
Run the eval again

Otherwise we tend to be poking in the dark. cc @Falco

Topic		Antwoorden	Weergaven
Discourse AI - Spam detection Site Management moderation , how-to , ai , spam	30	4333	10 maart 2026
Are you experiencing AI based spam? Community Building ai	22	2187	19 januari 2025
Setting up spam detection in your community Site Management moderation , automation , how-to , ai	10	2044	30 januari 2025
Discourse AI to make spam filter smarter? Feature completed , ai	1	487	18 mei 2024
Diagnosing spam attack of 100 topics Feature	34	3057	29 mei 2017

Moeten we de AI spamscanner standaard berichten laten markeren die telefoonnummers bevatten?

Gerelateerde topics