Je ne suis pas sûr que cela soit lié aux sitemaps ou à l’hébergement cloud. Meta est hébergé sur AWS, ce qui est un endroit complètement différent de celui où nous hébergeons bon nombre de nos autres clients, et nous avons commencé à constater des résultats très inégaux pour Meta récemment, ainsi que pour de nombreux sites sur diverses options d’hébergement.
J’ai essayé d’ajuster quelques éléments pour voir si quelque chose aide.
-
Nous ne suivons plus les liens vers
.rss, ce qui évite à Google d’analyser les variantes/1/2, etc. d’un sujet qui partagent tous un canonical. -
Nous indiquons explicitement à Google de ne pas suivre les liens dans le flux
.rssau cas où il obtiendrait un flux rss. -
J’ai temporairement désactivé certains ajustements de canonical que nous avions effectués - qui semblaient prometteurs : Search engines now blocked from indexing non-canonical pages
Le symptôme que j’observe ici sur meta est que
- Google explore TOUT le contenu, je peux le voir dans les journaux web.
- Malgré l’exploration des pages, environ 50 % des nouveaux sujets meta récents n’apparaissent pas dans l’index.
C’est extrêmement préoccupant, Google nous donne très peu de visibilité sur le “pourquoi ?”.
Ma prochaine étape est d’obtenir plus de données et de mettre en place un rapport continu. Nous utiliserons probablement serpapi pour déterminer quelles pages sont manquantes sur Google et essayer de trouver un schéma.