canonicalリンクヘッダーをnoindexヘッダーの代わりに送信する

canonical リンクヘッダーを noindex ヘッダーの代わりに送信します。

canonical ヘッダーを送信することは、noindex ヘッダーを送信することと同様に、クロール予算に利点がある可能性があります。ただし、noindex によってバックリンクを持つ可能性のある URL を除外するという SEO 上の悪影響はありません。


How to Specify a Canonical with rel="canonical" and Other Methods | Google Search Central  |  Documentation  |  Google for Developers も参照してください。

サーバーを構成できる場合は、HTML タグの代わりに rel="canonical" HTTP ヘッダーを使用して、PDF ファイルなどの HTML 以外のドキュメントを含む、検索でサポートされているドキュメントの正規 URL を示すことができます。

  • :+1: サーバーを構成できます。
  • HTML タグの代わりに rel="canonical" HTTP ヘッダーを使用することは、HTTP ヘッダー ソリューションの優先度を強調していますか?

#11553 より

Googlebot は no-index ヘッダーを非常にエレガントに処理します。可能な限り多くのルートを開いたままにし、インデックスに関する高忠実度のルールにはヘッダーを使用することを推奨しています。

おそらく、Google は canonical リンクヘッダーを no-index ヘッダーと同様にエレガントに処理するでしょう。

「いいね!」 1

Googleの推奨事項を読むと、特に気にしていないように見えます。

rel="canonical" HTTPヘッダーの推奨事項は、rel="canonical" linkタグと同じです。

失うものはあまりなく、no indexとrel canonicalの組み合わせがGoogleの正しいレシピである可能性もあります。しかし、確信が持てません。

@Falco さん?

これは最近導入されたサイト設定を、実質的に noop(ヘッダーで送信するものをヘッドタグとして移動するだけで、意味的な変更はない)にロールバックするものです。

この変更は現状のままでは望ましくありません。

「いいね!」 1

新しいデフォルトの SiteSetting.allow_indexing_non_canonical_urls = false では、現在の実装方法は以下の通りで、このまま維持されます。

  • ヘッダー noindex
  • html link-tag canonical (無視される可能性があります)

パッチなしで SiteSetting.allow_indexing_non_canonical_urls = true の場合

  • ヘッダーなし
  • html link-tag canonical

パッチありで SiteSetting.allow_indexing_non_canonical_urls = true の場合

  • ヘッダー: Link: <https://forum.example.com/t/test-example/1234>; rel="canonical"
  • html link-tag canonical (無視される可能性がありますが、いずれにしてもヘッダーと同じです)

これの背後にある考え方全体:
noindex http-header と同じ利点を得るために、canonicalhttp-header として設定します。つまり、より速いクロールです。
これにより、noindex はその不確かな影響とともに廃止される可能性があります。

noindexcanonical に関するもう 1 つの点:

  • noindex は、ページを検索インデックスに含めないようにするための非常に強力なシグナルです。
    しかし、noindex では、リンクを抽出するためにページコンテンツは Google ボットによって処理されます (これを無効にするための追加オプション nofollow があります)。
  • canonical は、クロールされるコンテンツが他の正規 URL にあるという強力なシグナルです。
    Google ボットが 1 ページに対してこのシグナルを受け入れると決定した場合、ページコンテンツはまったく処理されず、正規 URL のみが処理される可能性が高くなります。

これは*‘思考実験’*です。どこにも実装されておらず、実装することを推奨したこともありません。

  • ヘッダー noindex
  • html meta-tag noindex (代わりに: html link-tag canonical)

– または –

  • ヘッダーなし
  • html meta-tag noindex

これをこのように実装する理由、または実装しない理由は何ですか?

この変更は ‘noop’ ではありません。
Google は、処理キューの異なる段階でヘッダーや HTML コンテンツを処理する可能性があります。ヘッダーを送信することで、さらに処理キュー(例:レンダリングキュー)をスキップし、より重要なページのためにクロールバジェットを解放できる可能性があります。

In-Depth Guide to How Google Search Works | Google Search Central  |  Documentation  |  Google for Developers を参照してください。

(見つけた処理キューの唯一のグラフ:Understand JavaScript SEO Basics | Google Search Central  |  Documentation  |  Google for Developers

noindex の変更は最近ロールバックされました。

このPRを再検討していただけますでしょうか。

これに強く反対するわけではありませんが、非常に些細なことのように感じます。Googleは最近常にコンテンツをダウンロードしており、HTML解析を保存することが実質的な違いを生むとは思いません。

他の多くの領域に焦点を当てる必要があります。マイクロデータはおそらく最初に手入れが必要な場所です。