Devrions-nous dire au scanner de spam IA de signaler par défaut les publications contenant des numéros de téléphone ?

,

Il semble qu’une variété assez courante de spam soit constituée de publications de support client non pertinentes, probablement dans le but d’obtenir de fausses informations pour apparaître dans les résultats d’IA ou de recherche ? Celles-ci contiennent souvent des numéros de téléphone… devrions-nous mentionner les numéros de téléphone dans notre invite de spam IA ? Probablement peu courant pour les gens de publier cela dans des cas d’utilisation normaux ?

Invite par défaut existante
Vous êtes un système de détection de spam. Analysez le contenu et le contexte de la publication suivante.

Considérez attentivement le type de publication :
- Pour les publications de RÉPONSE : Vérifiez si la réponse est pertinente et d'actualité par rapport au fil de discussion
- Pour les publications de NOUVEAU SUJET : Vérifiez s'il s'agit d'un sujet légitime ou d'une promotion de spam

Une publication est considérée comme du spam si elle correspond à l'un des critères suivants :
- Contient du contenu commercial non sollicité ou des promotions
- Contient des liens externes suspects ou non pertinents
- Présente des schémas de publication automatisée/bot
- Contient du contenu ou des publicités non pertinents
- Pour les réponses : Complètement sans rapport avec le fil de discussion
- Utilise un excès de mots-clés ou des schémas de texte répétitifs
- Présente une mise en forme ou une utilisation de caractères suspectes

Soyez particulièrement strict avec :
- Les réponses qui ignorent la conversation précédente
- Les publications contenant plusieurs liens externes non pertinents
- Les réponses génériques qui pourraient être publiées n'importe où

Soyez juste envers :
- Les nouveaux utilisateurs qui font des contributions légitimes pour la première fois
- Les locuteurs non natifs qui font des efforts sincères pour participer
- Les mentions de produits pertinentes pour le sujet dans des contextes appropriés

Informations spécifiques au site :
- Nom du site : {site_title}
- URL du site : {site_url}
- Description du site : {site_description}
- 10 meilleures catégories du site : {top_categories}

Formatez votre réponse sous forme d'objet JSON avec une seule clé nommée "spam", qui est un booléen indiquant si une publication est du spam ou légitime.
Votre sortie doit être dans le format suivant :

{"spam": xx}

Où xx est vrai si la publication est du spam, ou faux si elle est légitime.
répondez uniquement avec du JSON valide
7 « J'aime »

Et je pense que souvent ces numéros de téléphone incluent diverses obfuscations de numéros de téléphone pour contourner les tests de numéros de téléphone regex (je ne sais pas vraiment, comme, euh, unicode ou autre chose ?). Existe-t-il un moyen de faire en sorte que l’IA recherche spécifiquement ceux-ci ?

2 « J'aime »

Nous pouvons faire quelques tests basés sur le spam que nous avons reçu, mais je soupçonne qu’il suffira de lui demander de rechercher les numéros de téléphone et de spécifier qu’elle doit prêter attention aux tentatives possibles d’obscurcissement par unicode pour en attraper la plupart ?

Je suppose qu’elle serait meilleure pour attraper les tentatives de dissimulation de numéros que les expressions régulières, simplement parce qu’elle est plus flexible.

1 « J'aime »

Venant de quelqu’un qui connaît peu l’IA et pas beaucoup l’Unicode (par rapport au groupe auquel j’espère que cela prête attention), cela semble génial ! :rofl:

Je le penserais aussi. Étant donné que l’IA peut identifier Unicode de manière fiable, il n’y a aucune raison pour qu’un numéro de téléphone contienne de l’Unicode, donc cela devrait être assez facile. À l’époque de la classification bayésienne simple, un numéro de téléphone Unicode serait un très bon indicateur de spam. Un tas d’entre eux avaient également un étrange symbole TM Unicode et quelques autres.

Et s’il pouvait rechercher de manière fiable des choses comme « support client » dans une entreprise qui n’est pas connectée au forum, ce serait également une cible facile.

2 « J'aime »

Une grande partie de cela dépend de « nous avons besoin d’évaluations » :

Nous avons :

Ce que nous devons faire ici est :

  1. Ajouter un grand nombre de publications de spam/ham à la suite d’évaluation (disons 20-30 chacune)
  2. Exécuter l’évaluation
  3. Corriger l’invite
  4. Exécuter à nouveau l’évaluation

Sinon, nous avons tendance à tâtonner dans le noir. cc @Falco

3 « J'aime »