Je commence à penser que ma logique était erronée dès le départ. Cela expliquerait pourquoi personne n’a répondu - peut-être que rien ne va mal.
Voici un nouvel article expliquant qu’il est normal que Google affiche une page blanche dans la capture d’écran
Je peux maintenant voir le HTML « crawl » de la page d’accueil, c’est la version indexée, pas celle du « test en direct » - elle affiche la page complète. Gardez à l’esprit que Google a compris cela tout en leur servant l’application JS complète.
Ce qui est intéressant, c’est qu’ils sont descendus jusqu’à environ le 27e message sur la page d’accueil en termes d’indexation. Le défilement infini est donc quelque chose que Google comprend.
Je ne sais pas si cela a aidé, mais j’ai décoché le paramètre ajax dans les paramètres d’administration. Cela a amené Google à trouver des URL comme celle ci-dessous (et à servir la version pour crawler) - je l’ai décoché, et maintenant cette URL affichera la version JS
https://discuss.flynumber.com/t/japan-phone-numbers-disconnect-notice/2351?_escaped_fragment_=
Maintenant, tout ce qu’il me reste à faire est de trouver comment nettoyer ces URL canoniques supplémentaires que discourse crée pour les pages utilisateur.
