Vues anonymes soudainement très élevées

Une observation secondaire qui soulève une question : l’utilisation de Cloudflare pourrait-elle également aider à l’indexation par Google ?

J’ai remarqué quelques améliorations hier, une tendance positive en matière d’indexation et d’impressions, mais cela pourrait être une coïncidence. :thinking:

J’ai remarqué une forte augmentation vers la fin octobre. Ceux-ci doivent contourner la fonctionnalité de mitigation Bloquer les robots IA de CF.

CF suggère maintenant d’utiliser l’IA Labyrinthe :

L’IA Labyrinthe modifie vos pages web en ajoutant des liens nofollow contenant du contenu généré par l’IA pour perturber les robots qui ignorent les normes de crawl. Les liens nofollow ajoutés ne modifient pas le contenu de vos pages web et ne sont visibles que par les robots.

Combattre l’IA avec l’IA ? :grimacing:

Course aux armements de l’IA ?

1 « J'aime »

C’est une course aux armements et, comme avec les spammeurs, je soupçonne que cela le sera toujours.

Quelle est l’option sans Cloudflare (bunker antiatomique) comme intermédiaire pour atténuer cela, ou est-ce la seule option ?

Il semble que ce soit tout ou rien, et rien = trafic IA qui se comporte comme un DDOS ! :frowning:

1 « J'aime »

Cette vague est un vrai casse-tête (PITA), la mesure la plus efficace a été le blocage géographique total du trafic provenant de toutes les zones géographiques, à l’exception de la zone géographique d’où provient actuellement la majorité du trafic.

Il y a tellement d’ASN potentiellement impliqués dans cette vague que les identifier est un processus lent.

Cela rend les choses très non viables à moyen et long terme.

1 « J'aime »

Pour moi, ce qui compte le plus, c’est l’expérience des vrais utilisateurs humains, qu’ils soient membres ou simples lecteurs. Tant que la réactivité de mon forum est correcte, que je n’ai pas de frais pour un trafic supplémentaire, ou que mon espace de stockage ne se remplit pas de journaux, ce trafic indésirable supplémentaire n’est pas vraiment une préoccupation.

Il est bien sûr possible que mes coûts augmentent si j’ai besoin d’ajouter de la RAM, du stockage ou des processeurs, ou si je dois payer pour un trafic excessif. Cela ne m’est pas encore arrivé.

2 « J'aime »

Oui, l’expérience utilisateur est primordiale, c’est tout l’objet de ce sujet. Nous n’existons que grâce aux « utilisateurs », mais parfois je me demande si les développeurs et autres oublient cela. :thinking:

Ces choses d’IA chargent tellement le serveur que vous commencez à obtenir des erreurs 50x. Surtout si vous essayez une recherche. La plateforme peut supporter beaucoup de trafic et tenir, mais elle devient un peu bancale.

Je me demande avec quelles spécifications vous travaillez et si c’est derrière CF ou un autre WAF ?

J’ai vu cette poussée d’IA frapper des droplets 4vCPU 8Go 160+Go HD, qui gèrent facilement des dizaines d’utilisateurs uniques lors d’une véritable vague de visiteurs uniques, commencer à vraiment souffrir sous l’aspiration de l’IA.

Faire tourner Discourse sur un droplet d’entrée de gamme, disons un droplet de 2 Go, très rapidement la plateforme commencera à plier et à s’effondrer, si elle n’est pas derrière quelque chose comme CF.

Ce facteur ne se produisait pas avant l’IA, à moins d’avoir un sujet brûlant. J’ai vu cela se produire, mais seulement après coup, car il n’y avait pas de différence perceptible dans les performances, Discourse gérait le service sans problème.

En regardant les données moyennes de CF servies par jour, environ 2 Go par jour sur un mois, lorsque cette vague a frappé, cela a bondi à 14 Go sans signe d’arrêt, jusqu’à ce que certaines règles WAF remettent de l’ordre dans l’assaut.

Devoir intensifier la friction à l’entrée signifie que les utilisateurs qui veulent vraiment entrer y parviennent, vous devez valoriser ceux-là, mais plus ou moins le trafic organique supplémentaire et ainsi de suite, eh bien cela ne posera pas de problème.

Comme je l’ai dit, la viabilité à moyen et long terme pose un problème très sérieux ici.

Cela nécessite maintenant des ressources de temps et aussi d’argent, l’un ou l’autre. Je n’ai aucune idée de comment contourner cela autrement que par la posture actuelle, et il y a ensuite l’option nucléaire, couper le courant. J’ai vu des sites fermer pour moins que ça.

L’internet ouvert n’a pas été conçu pour ce genre de jeu.

Certainement, si vous constatez que vous recevez des erreurs 50x, c’est quelque chose de dramatique.

J’avais l’habitude de fonctionner derrière Cloudflare et je le referais si j’avais un problème : mon idée est qu’ils ont une vue centrale de tout le trafic malveillant et qu’ils peuvent réagir rapidement et de manière centralisée. Je crois qu’ils ont des offres spécifiques pour arrêter les robots d’exploration d’IA malveillants. Je ne m’attendrais pas à ce que les méthodes locales fonctionnent très bien dans cette course aux armements.

Tout comme je paie de petits frais à Mailgun pour gérer le courrier, ce dont je n’aurais pas besoin dans un monde idéal, j’accepterais de devoir payer de petits frais à quelqu’un pour bloquer ce trafic indésirable.