Comment noindex toutes les pages pour les exclure des index Google

J’ai vu :

mais il n’est pas clair quelle a été la conclusion de cette discussion. Une directive noindex dans robots.txt n’est plus efficace — Google l’ignore désormais. Pour empêcher qu’un site privé n’apparaisse du tout dans les résultats de recherche, l’option Disallow ne suffit pas. Ce qu’il faut, c’est une balise meta noindex sur chaque page concernée. Dans notre cas, il s’agit de la page de connexion et de toutes les pages d’erreur accessibles de l’extérieur (ou, pour être tout à fait clair, une balise meta noindex sur chaque page conviendrait parfaitement).

Comment cela peut-il être réalisé ? Merci.

La « conclusion » ou issue de cette discussion semble très claire :

  • une nouvelle fonctionnalité a été ajoutée pour inclure noindex sur les pages qui ne doivent pas être explorées
  • cette nouvelle fonctionnalité a dû être supprimée/annulée car Google ne la prenait pas en charge et signalait ensuite robots.txt comme invalide.

Oui, Google a cessé de prendre en charge noindex dans robots.txt. Mais leur recommandation actuelle semble être d’ajouter une balise meta noindex sur toutes les pages que vous souhaitez totalement supprimer de leur index. C’est ce que j’essaie de réaliser.

Ne pouvez-vous pas simplement créer un composant de thème qui ajoute la balise meta noindex à toutes les pages ?

Il suffit d’ajouter

<meta name="noindex">

dans /admin/ customize/ themes/ common/ head_tag

C’est bien ça ?

Désolé, j’aurais dû être plus explicite : la première partie du message du sujet doit être supprimée.

Il vaut probablement mieux vous référer à l’annonce de Google, car elle contient un lien vers l’option HTML de page que pfaffman suggère ci-dessus :
Bloquer l’indexation par les moteurs de recherche avec ‘noindex’

Je n’ai pas beaucoup travaillé sur les thèmes, donc c’est exactement ce dont j’avais besoin. Merci ! Et cela s’affiche correctement dans l’en-tête (ajouté à “head_tag”). Pour information, la balise recommandée par Google si vous souhaitez demander à tous les robots de ne pas indexer est :

<meta name="robots" content="noindex">

J’ai maintenant désactivé (en fait, j’ai simplement commenté) robots.txt complètement pour les raisons mentionnées plus tôt dans ce fil. Merci encore.

Ravi d’avoir pu aider ! Je ne suis toujours pas très doué avec les thèmes et je ne sais rien du SEO, donc je ne savais pas à quoi le balise meta devait ressembler vraiment. Heureux d’avoir pu vous donner suffisamment d’indices pour que vous puissiez résoudre le problème.