Notification de Google pour supprimer les déclarations "noindex" de robots.txt

Arta_S · Juillet 29, 2019, 10:28

Bonjour,

Je viens de recevoir cet e-mail de Google :

Supprimez les déclarations « noindex » du fichier robots.txt de

Cela est-il connu de la communauté ? Dois-je prendre des mesures ?

Merci

NicholasDev · Juillet 29, 2019, 10:46

On dirait que Google vient de l’envoyer, j’ai reçu un e-mail aussi.

WaitroseCarpark · Juillet 29, 2019, 11:02

Moi aussi, je poste pour suivre les opinions, etc.

irenz · Juillet 29, 2019, 11:11

Pour le même e-mail, dois-je m’en occuper moi-même ? Comment faire ?

Steven · Juillet 29, 2019, 12:07

Ne vous inquiétez pas, cela est codé dans le noyau : l’équipe de Discourse le mettra à jour et, dans quelques jours, ce sera corrigé. Nous n’aurons qu’à mettre à niveau notre Discourse.

Cependant, pour les plus impatients, vous pouvez dès maintenant éditer le fichier robots.txt :

jrivettcsa · Juillet 29, 2019, 2:12

Google Search Console m’envoie des messages concernant notre site Discourse :

Supprimez les déclarations ‘noindex’ du fichier robots.txt de https://discourse.hookproductivity.com/

À l’attention du propriétaire de https://discourse.hookproductivity.com/,

Google a identifié que le fichier robots.txt de votre site contient la règle non prise en charge ‘noindex’.

Cette règle n’a jamais été officiellement prise en charge par Google et cessera de fonctionner le 1er septembre 2019. Veuillez consulter notre centre d’aide pour savoir comment bloquer des pages de l’index Google.

awesomerobot · Juillet 29, 2019, 2:37

Si vous n’avez pas personnalisé votre fichier robots.txt, vous n’avez rien à faire… disallow fait déjà la majeure partie du travail.

Par défaut, Discourse utilise à la fois disallow et noindex dans le fichier robots.txt.

Dans cet article de blog sur cette mise à jour, Google recommande d’utiliser disallow, ce que nous faisons déjà. Nous utilisons noindex en complément pour aider à éviter ce problème de liens mentionné par Google (j’ai mis en évidence la partie pertinente)…

Disallow dans robots.txt : Les moteurs de recherche ne peuvent indexer que les pages qu’ils connaissent, donc bloquer l’accès à une page en empêchant son exploration signifie généralement que son contenu ne sera pas indexé. Bien que le moteur de recherche puisse également indexer une URL sur la base de liens provenant d’autres pages, sans voir le contenu lui-même, nous visons à rendre ces pages moins visibles à l’avenir.

De notre côté, nous envisageons une mise à jour pour ajouter la balise meta noindex ou utiliser l’en-tête X-Robots-Tag dans nos réponses HTTP afin de nous assurer que Google n’indexe pas le lien lorsqu’il apparaît sur d’autres pages (nous mettrons à jour ce sujet avec toute modification).

Si vous avez ajouté des règles personnalisées noindex dans robots.txt via votre page d’administration /admin/customize/robots, vous devriez les remplacer par disallow.

codinghorror · Juillet 30, 2019, 6:02

La présence de noindex dans robots.txt était un changement de « référencement » malavisé que nous avons malheureusement été convaincus d’appliquer il y a environ un an. Ce changement a maintenant été annulé et le correctif a été rétroporté sur la version stable.

Sujet		Réponses	Vues
Google changed how they process robots.txt in Discourse? Support	20	1805	Décembre 22, 2020
I have indexed my site to google and get error “No: ‘noindex’ detected in ‘X-Robots-Tag’”. How to remove this header tag? Data & reporting analytics	4	1220	Avril 24, 2025
Pages listed in the robots.txt are crawled and indexed by Google Support	18	3401	Juillet 30, 2019
How to noindex all pages to keep them out of Google indexes Support	6	2856	Mars 7, 2020
Generic rules in "robots.txt" not picked up by Googlebot Support	5	1052	Mars 3, 2022

Notification de Google pour supprimer les déclarations "noindex" de robots.txt

Sujets connexes