Google が当社のディスコースコミュニティのコンテンツをインデックスに登録しない理由がわかりません。
こちらのページをご覧ください: Welcome to the Appsmith Community | Appsmith Community Portal
タイトルはかなりユニークです。タイトルを Google にコピー&ペーストすると、最初のリンクはこの URL になるはずです。
代わりに表示されるのはこれです: 最初のリンクであるだけでなく、まったく表示されません。
何が間違っていますか?
「いいね!」 2
IAmGav
(Gavin Perch)
2
これには非常に多くの理由が考えられます。
Googlebotは実際にあなたのサイトをクロールしていますか? mysite.com/admin/reports/web_crawlers を確認してください。
Googlebotはブロックされているか、レート制限されていますか? mysite.com/admin/site_settings/category/security?filter=crawler%20user%20agents を確認してください。
Google Search Console にサイトを追加しましたか?
セルフホストしている場合は、次のプラグインをインストールして役立てることもできます。
「いいね!」 2
gerhard
(Gerhard Schlager)
3
サイトマッププラグインは、ビジネスプランおよびエンタープライズプランでもご利用いただけます。
おそらく何も間違っていません。何らかの理由で、Google は「X を実行する方法」というクエリを、そのトピックと完全に一致するタイトルの実際のトピックよりも優先しているようです。なぜでしょうか? よくわかりません。AI が未知のパターンに基づいてその決定を下しているだけかもしれません。
「いいね!」 6
それは私たちにとって大きな問題ですね。この件については調査しますが、コミュニティ内のすべてのトピックを「確認する」ことを期待することはできないため、全体的な目的が損なわれることになります。実際には、ほとんどの人は(コミュニティのメンバーであっても)問題をグーグルで検索して回答にたどり着くでしょう。
「いいね!」 2
gerhard
(Gerhard Schlager)
6
Googleで何が起こっているのか、あなたのケースでは判断が難しいです。クロール統計を詳しく確認したところ、Googleのクローラーがあまりあなたのコミュニティを訪れていないように見えます。この問題の根本原因を突き止めるのに役立つ情報があるかもしれないので、Google Search Consoleから洞察を得ようと試みましたか?
Metaの最近作成されたトピックの一部でも同じような挙動が見られます。チームと話し合い、何かできることがあるか、あるいは単にGoogleがGoogleであるだけなのかを突き止めます。進捗があり次第、お知らせします。
また、SEOに関する私たちの2つのブログ記事はご覧になりましたか?
「いいね!」 2
mstm
(mstm)
7
このGoogleの動作は数ヶ月前から始まり、残念ながら悪化しています。
私の場合はサイトマップは役に立ちませんでした…
「いいね!」 1
ええと…私たちのサイトはappsmith.comなので、appsmith.comをGSCに送信すれば、appsmith.comのすべてのサブドメインとサブフォルダがインデックスに登録されるのが理想ですよね?
コミュニティ.appsmith.com(私たちのディスコースフォーラム)を本日GSCに追加しましたが、それが何か変更されるかはわかりません。
arkklo
(Ark)
11
サブドメインをGSCでスタンドアロンプロパティとして追加し、サブドメイン専用のサイトマップを送信することをお勧めします。
「いいね!」 1
IAmGav
(Gavin Perch)
12
@constantine
あなたのフォーラムは2021年5月からインデックスされています
はい 
これは問題のようですね。Googleが個々の投稿をインデックスしない場合、コミュニティを持つことの全体的な目的が事実上無効になるため、続行することはできません(ほとんどの人がGoogleからコンテンツを発見するため、現在のユーザーを含め、Discourseのカテゴリを介して発見するのではなく)。
そして、これは私たちのDiscourseだけでなく、このフォーラム(meta.discourse.org)でも問題ではないようです。
これを実証するために、この投稿のタイトルをGoogleで検索したところ、次の結果が得られました。
基本的に、Discourseコミュニティをナレッジベースとして利用する人々(もちろん多くの企業がそうしています)にとって、これは大きな問題になります。
上記のブログで共有されたSEOに関するガイドラインのほとんどすべてに従っており、コンテンツは豊富で詳細、かつ高度に技術的です。それにもかかわらず、人々がGoogleで検索しても表示されません。
そこで、皆さんにお聞きしたい genuine questions があります。私たちのユースケース(サポートクエリを通じてナレッジベースを作成し、SEOにも役立つ)と、この問題点を考慮すると、代替手段を見つける計画を立て始めることをお勧めしますか?
「いいね!」 1
IAmGav
(Gavin Perch)
14
Google によるコンテンツのインデックス登録は、ユーザーの需要と品質チェックを考慮するシステムアルゴリズムによって決定されます。
また、nofollow リンクが無効になっているのは TL3 以上のユーザーのみであることに注意してください。
こちらも参照してください。
つまり、私の投稿はあなたの投稿よりも「重み」があります。
rrit
(Ayke)
17
@constantine Google は、https://community.appsmith.com のページよりも、サブドメイン https://docs.appsmith.com のページを優先しているようです。
検索結果のほとんどは docs.appsmith.com からのものです。
Google Search
推測ですが、Google が一方のサブドメインをもう一方よりも優先するのは、「Core Web Vitals」のLargest Contentful Paint (LCP) に影響されている可能性があります。
https://pagespeed.web.dev/ のシミュレーションレポートは、Discourse によって「バグ」が発生しています。ドメインの Google Search Console レポート「Experience」→「Core Web Vitals」を確認した方が良いでしょう。
皆さん、アップデートです。ディスコースをセルフホストし、サイトマップをサーチコンソールに送信したところ、Googleでコンテンツがインデックスされるようになりました。クラウドホスト版に何か問題があるのでしょうか?
sam
(Sam Saffron)
19
メタサイトマップまたはクラウドホスティングに関連しているかどうかわかりません。MetaはAWSでホストされており、他の多くの顧客をホストしている場所とは全く異なります。最近Metaで非常にばらつきのある結果が見られ始め、さまざまなホスティングオプションにわたるかなりの数のサイトでも同様です。
何か役立つかを確認するために、いくつかのことを調整しようとしています。
ここでMetaで観察している症状は次のとおりです。
- Googleは実際にすべてのコンテンツをクロールしています。ウェブログで確認できます。
- ページをクロールしているにもかかわらず、最近の新しいMetaトピックの約50%がインデックスに表示されていません。
これは非常に懸念されることです。Googleは「なぜ?」という理由についてほとんど可視性を提供してくれません。
次のステップは、より多くのデータを取得し、継続的なレポートを作成することです。おそらくserpapiを使用して、Googleから欠落しているページを特定し、パターンを特定しようとします。
「いいね!」 5
Jagster
(Jakke Lehtonen)
20
Meta、つまりOPがGoogleが望むような「なぜ?」を使用していないからでしょうか? いくつかの実験を行ったところ、文脈が同じであっても、異なる文章を使用すると検索結果が変わることがわかりました。予想通りです。
そして…個人の検索履歴は大きく、あまり良いものではありません。私の検索結果は、ここで検索しているため、Google経由ではなく、Metaとは異なる場所にたどり着くことがよくあります。
はい。それでもDiscourseはGoogleとの間に何らかの問題を抱えている可能性があり、それはGoogleが通常のウェブサイトと同じようにフォーラムに反応しない「フォーラムのステータス」に起因する可能性も、しない可能性もあります。あるいは、技術的な問題があるのかもしれません。それも非常にまれな理由ですが。
mstm
(mstm)
21
私がやったことと同じです。最初は改善が見られましたが、その後無視されるようになりました。
2か月経っても、サイトマップの新しいスレッドさえインデックスされなくなりました。この状況は数か月続いており、多くのビューを失いました。
1か月間試してみて、改善が見られない場合はソフトウェアを変更します 
rrit
(Ayke)
22
「インデックス」→「カバレッジ」のレポートで、Google Search Console の「除外された」ページを確認してください。これにより、「なぜ」ではなく「何が起こっているか」がわかるかもしれません。
-
ドメインの「インデックス」→「カバレッジ」(https://search.google.com/search-console/index?hl=en)を開きます。
-
「送信されたすべてのページ」を選択します。
-
特に「除外された」を確認します。
各ステータスの説明:Page indexing report - Search Console Help
Google に関する私の仮説:「クロール済み - インデックス未登録」には Google によって設定された上限があり、この状態のページが多すぎると、新しいページは Google インデックスに非常にゆっくりとしか追加されません。
Google クローラーのパフォーマンスについては、Google Search Console の「設定」→「クロール統計情報」(https://search.google.com/search-console/settings/crawl-stats?hl=en)レポートを確認してください。
ここでは、特に「平均応答時間」のタイムラインと推移が興味深いです。応答が速いほど、クロールリクエストが多くなります。
また、「目的別」も興味深いです。