Bonjour,
Je viens de recevoir cet e-mail de Google :
Supprimez les déclarations « noindex » du fichier robots.txt de
Cela est-il connu de la communauté ? Dois-je prendre des mesures ?
Merci
Bonjour,
Je viens de recevoir cet e-mail de Google :
Supprimez les déclarations « noindex » du fichier robots.txt de
Cela est-il connu de la communauté ? Dois-je prendre des mesures ?
Merci
On dirait que Google vient de l’envoyer, j’ai reçu un e-mail aussi.
Moi aussi, je poste pour suivre les opinions, etc.
Pour le même e-mail, dois-je m’en occuper moi-même ? Comment faire ?
Ne vous inquiétez pas, cela est codé dans le noyau : l’équipe de Discourse le mettra à jour et, dans quelques jours, ce sera corrigé. Nous n’aurons qu’à mettre à niveau notre Discourse.
Cependant, pour les plus impatients, vous pouvez dès maintenant éditer le fichier robots.txt :
Google Search Console m’envoie des messages concernant notre site Discourse :
Supprimez les déclarations ‘noindex’ du fichier robots.txt de https://discourse.hookproductivity.com/
À l’attention du propriétaire de https://discourse.hookproductivity.com/,
Google a identifié que le fichier robots.txt de votre site contient la règle non prise en charge ‘noindex’.
Cette règle n’a jamais été officiellement prise en charge par Google et cessera de fonctionner le 1er septembre 2019. Veuillez consulter notre centre d’aide pour savoir comment bloquer des pages de l’index Google.
Si vous n’avez pas personnalisé votre fichier robots.txt, vous n’avez rien à faire… disallow fait déjà la majeure partie du travail.
Par défaut, Discourse utilise à la fois disallow et noindex dans le fichier robots.txt.
Dans cet article de blog sur cette mise à jour, Google recommande d’utiliser disallow, ce que nous faisons déjà. Nous utilisons noindex en complément pour aider à éviter ce problème de liens mentionné par Google (j’ai mis en évidence la partie pertinente)…
Disallow dans robots.txt : Les moteurs de recherche ne peuvent indexer que les pages qu’ils connaissent, donc bloquer l’accès à une page en empêchant son exploration signifie généralement que son contenu ne sera pas indexé. Bien que le moteur de recherche puisse également indexer une URL sur la base de liens provenant d’autres pages, sans voir le contenu lui-même, nous visons à rendre ces pages moins visibles à l’avenir.
De notre côté, nous envisageons une mise à jour pour ajouter la balise meta noindex ou utiliser l’en-tête X-Robots-Tag dans nos réponses HTTP afin de nous assurer que Google n’indexe pas le lien lorsqu’il apparaît sur d’autres pages (nous mettrons à jour ce sujet avec toute modification).
Si vous avez ajouté des règles personnalisées noindex dans robots.txt via votre page d’administration /admin/customize/robots, vous devriez les remplacer par disallow.
La présence de noindex dans robots.txt était un changement de « référencement » malavisé que nous avons malheureusement été convaincus d’appliquer il y a environ un an. Ce changement a maintenant été annulé et le correctif a été rétroporté sur la version stable.