No estoy seguro de si esto está relacionado con sitemaps o alojamiento en la nube. Meta está alojado en AWS, que es un lugar completamente diferente a donde alojamos a muchos de nuestros otros clientes, y hemos comenzado a ver resultados muy desiguales para Meta últimamente y bastantes sitios en varias opciones de alojamiento.
He estado intentando ajustar algunas cosas para ver si algo ayuda.
-
Ya no seguimos enlaces a
.rss, lo que evita que Google escanee las variantes/1/2, etc. de un tema que comparten el mismo canónico. -
Le indicamos explícitamente a Google que no siga los enlaces dentro del feed
.rssen caso de que obtenga un feed rss. -
Desactivé temporalmente algunos ajustes canónicos que hicimos, lo cual mostró resultados prometedores: Search engines now blocked from indexing non-canonical pages
El síntoma que estoy observando aquí en Meta es que
- Google está rastreando TODO el contenido, puedo verlo en los registros web.
- A pesar de rastrear las páginas, aproximadamente el 50% de los temas nuevos recientes de Meta no aparecen en el índice.
Esto es extremadamente preocupante, Google nos está dando muy poca visibilidad de “por qué” aquí.
Mi próximo paso es obtener más datos y un informe continuo. Probablemente usaremos serpapi para averiguar qué páginas faltan en Google e intentar encontrar un patrón.