Dovremmo dire allo scanner di spam AI di segnalare i post contenenti numeri di telefono per impostazione predefinita?

awesomerobot · 15 Settembre 2025, 2:40pm

Sembra un tipo di spam abbastanza comune, ovvero post di assistenza clienti non correlati, probabilmente nel tentativo di far apparire informazioni false nell’IA o nei risultati di ricerca? Questi spesso contengono numeri di telefono… dovremmo menzionare i numeri di telefono nel nostro prompt per lo spam dell’IA? Probabilmente è raro che le persone li pubblichino nei normali casi d’uso?

Prompt predefinito esistente

Sei un sistema di rilevamento dello spam. Analizza il seguente contenuto e contesto del post.

Considera attentamente il tipo di post:
- Per i post di RISPOSTA: verifica se la risposta è pertinente e attuale alla discussione
- Per i post di NUOVO ARGOMENTO: verifica se si tratta di un argomento legittimo o di una promozione di spam

Un post è spam se corrisponde a uno qualsiasi di questi criteri:
- Contiene contenuti commerciali non richiesti o promozioni
- Ha link esterni sospetti o non correlati
- Mostra schemi di posting automatizzati/bot
- Contiene contenuti o pubblicità irrilevanti
- Per le risposte: completamente non correlato alla discussione
- Utilizza parole chiave eccessive o schemi di testo ripetitivi
- Mostra formattazione o utilizzo di caratteri sospetti

Sii particolarmente rigoroso con:
- Risposte che ignorano la conversazione precedente
- Post contenenti più link esterni non correlati
- Risposte generiche che potrebbero essere pubblicate ovunque

Sii equo con:
- Nuovi utenti che danno contributi legittimi per la prima volta
- Non madrelingua che si impegnano sinceramente a partecipare
- Menzioni di prodotti pertinenti all'argomento in contesti appropriati

Informazioni specifiche del sito:
- Nome del sito: {site_title}
- URL del sito: {site_url}
- Descrizione del sito: {site_description}
- 10 categorie principali del sito: {top_categories}

Formatta la tua risposta come un oggetto JSON con una singola chiave chiamata "spam", che è un booleano che indica se un post è spam o legittimo.
La tua output dovrebbe essere nel seguente formato:

{"spam": xx}

Dove xx è true se il post è spam, o false se è legittimo.
rispondi solo con JSON valido

pfaffman · 15 Settembre 2025, 3:53pm

E penso che spesso quei numeri di telefono includano varie offuscazioni di numeri di telefono per aggirare i test sui numeri di telefono regex (non lo so davvero, tipo, uh, unicode o qualche altra sciocchezza?). C’è un modo per far sì che l’IA cerchi specificamente quelli?

awesomerobot · 15 Settembre 2025, 4:06pm

Possiamo fare dei test basati sullo spam che abbiamo ricevuto, ma sospetto che chiedere all’IA di cercare numeri di telefono e specificare che dovrebbe prestare attenzione ai possibili tentativi di offuscamento tramite unicode sia sufficiente per catturarne la maggior parte?

Suppongo che sarebbe più brava a catturare i tentativi di nascondere i numeri rispetto alle espressioni regolari, semplicemente perché è più flessibile.

pfaffman · 15 Settembre 2025, 4:42pm

Venendo da qualcuno che sa poco di AI e non molto di unicode (rispetto al gruppo che spero stia prestando attenzione a questo), sembra fantastico!

Lo penserei anch’io. Dato che l’AI può identificare Unicode in modo affidabile, non c’è motivo per cui un numero di telefono debba contenere Unicode, quindi dovrebbe essere abbastanza facile. Ai tempi della semplice classificazione bayesiana, un numero di telefono Unicode sarebbe un ottimo indicatore di spam. Molti di essi contenevano anche qualche strano simbolo TM unicode e un paio di altri.

E se potesse cercare in modo affidabile cose come “assistenza clienti” presso un’azienda non collegata al forum, anche quella sarebbe una facile vittoria.

sam · 15 Settembre 2025, 11:23pm

Molto di questo dipende da “abbiamo bisogno di valutazioni”:

Abbiamo:

Quello che dobbiamo fare qui è:

Aggiungere un bel po’ di post spam/ham alla suite di valutazione (diciamo 20-30 ciascuno)
Eseguire la valutazione
Correggere il prompt
Eseguire nuovamente la valutazione

Altrimenti tendiamo a procedere alla cieca. cc @Falco

Argomento		Risposte	Visualizzazioni
Discourse AI - Spam detection Site Management moderation , how-to , ai , spam	30	4686	Marzo 10, 2026
Are you experiencing AI based spam? Community Building ai	22	2300	Gennaio 19, 2025
Setting up spam detection in your community Site Management moderation , automation , how-to , ai	10	2101	Gennaio 30, 2025
Discourse AI to make spam filter smarter? Feature completed , ai	1	496	Maggio 18, 2024
Diagnosing spam attack of 100 topics Feature	34	3118	Maggio 29, 2017

Dovremmo dire allo scanner di spam AI di segnalare i post contenenti numeri di telefono per impostazione predefinita?

Argomenti correlati