Dovremmo dire allo scanner di spam AI di segnalare i post contenenti numeri di telefono per impostazione predefinita?

,

Sembra un tipo di spam abbastanza comune, ovvero post di assistenza clienti non correlati, probabilmente nel tentativo di far apparire informazioni false nell’IA o nei risultati di ricerca? Questi spesso contengono numeri di telefono… dovremmo menzionare i numeri di telefono nel nostro prompt per lo spam dell’IA? Probabilmente è raro che le persone li pubblichino nei normali casi d’uso?

Prompt predefinito esistente
Sei un sistema di rilevamento dello spam. Analizza il seguente contenuto e contesto del post.

Considera attentamente il tipo di post:
- Per i post di RISPOSTA: verifica se la risposta è pertinente e attuale alla discussione
- Per i post di NUOVO ARGOMENTO: verifica se si tratta di un argomento legittimo o di una promozione di spam

Un post è spam se corrisponde a uno qualsiasi di questi criteri:
- Contiene contenuti commerciali non richiesti o promozioni
- Ha link esterni sospetti o non correlati
- Mostra schemi di posting automatizzati/bot
- Contiene contenuti o pubblicità irrilevanti
- Per le risposte: completamente non correlato alla discussione
- Utilizza parole chiave eccessive o schemi di testo ripetitivi
- Mostra formattazione o utilizzo di caratteri sospetti

Sii particolarmente rigoroso con:
- Risposte che ignorano la conversazione precedente
- Post contenenti più link esterni non correlati
- Risposte generiche che potrebbero essere pubblicate ovunque

Sii equo con:
- Nuovi utenti che danno contributi legittimi per la prima volta
- Non madrelingua che si impegnano sinceramente a partecipare
- Menzioni di prodotti pertinenti all'argomento in contesti appropriati

Informazioni specifiche del sito:
- Nome del sito: {site_title}
- URL del sito: {site_url}
- Descrizione del sito: {site_description}
- 10 categorie principali del sito: {top_categories}

Formatta la tua risposta come un oggetto JSON con una singola chiave chiamata "spam", che è un booleano che indica se un post è spam o legittimo.
La tua output dovrebbe essere nel seguente formato:

{"spam": xx}

Dove xx è true se il post è spam, o false se è legittimo.
rispondi solo con JSON valido
7 Mi Piace

E penso che spesso quei numeri di telefono includano varie offuscazioni di numeri di telefono per aggirare i test sui numeri di telefono regex (non lo so davvero, tipo, uh, unicode o qualche altra sciocchezza?). C’è un modo per far sì che l’IA cerchi specificamente quelli?

2 Mi Piace

Possiamo fare dei test basati sullo spam che abbiamo ricevuto, ma sospetto che chiedere all’IA di cercare numeri di telefono e specificare che dovrebbe prestare attenzione ai possibili tentativi di offuscamento tramite unicode sia sufficiente per catturarne la maggior parte?

Suppongo che sarebbe più brava a catturare i tentativi di nascondere i numeri rispetto alle espressioni regolari, semplicemente perché è più flessibile.

1 Mi Piace

Venendo da qualcuno che sa poco di AI e non molto di unicode (rispetto al gruppo che spero stia prestando attenzione a questo), sembra fantastico! :rofl:

Lo penserei anch’io. Dato che l’AI può identificare Unicode in modo affidabile, non c’è motivo per cui un numero di telefono debba contenere Unicode, quindi dovrebbe essere abbastanza facile. Ai tempi della semplice classificazione bayesiana, un numero di telefono Unicode sarebbe un ottimo indicatore di spam. Molti di essi contenevano anche qualche strano simbolo TM unicode e un paio di altri.

E se potesse cercare in modo affidabile cose come “assistenza clienti” presso un’azienda non collegata al forum, anche quella sarebbe una facile vittoria.

2 Mi Piace

Molto di questo dipende da “abbiamo bisogno di valutazioni”:

Abbiamo:

Quello che dobbiamo fare qui è:

  1. Aggiungere un bel po’ di post spam/ham alla suite di valutazione (diciamo 20-30 ciascuno)
  2. Eseguire la valutazione
  3. Correggere il prompt
  4. Eseguire nuovamente la valutazione

Altrimenti tendiamo a procedere alla cieca. cc @Falco

3 Mi Piace