こんにちは。当社のウェブサイトには中国語版がありますが、残念ながらフォーラムのトピックが百度でインデックスされません。このフォーラムは問題なく百度でインデックスされているのを目にしました。このフォーラムの管理者および中国語でフォーラムを立ち上げたコミュニティメンバーへの質問ですが、百度でトピックをインデックスさせるためにどのような対策を講じましたか?
フォーラムは4月に立ち上げられたので、それが原因ではないと思われます。ブラックリストに登録されたクローラーの設定は、あなたのスクリーンショットと同じです。また、robots.txt には Baidu bot に対する制限もありません。
百度検索エンジンは何と言っていますか?私の知る限り、以前は ziyuan.baidu というセクションがあり、そこで Baidu に追加されたサイトのステータスに関する詳細情報を取得できました。
Discourse はインデックス作成のために追加の設定を必要としません。スキャナーがブラックリストに掲載されていない限り、問題はないはずです。
トピックに関する更新情報です。ziyuan.baidu.com にアカウントを作成しました。特に問題は見当たりません。クローラーはページの内容を正しく取得しています。また、サーバー側にログを実装しました。Baidu は、200 のサーバーレスポンスを伴い、トピックページに対して1日に数十件のリクエストを送っています。
もう一つ興味深い点は、私たちが孤立していないということです。対応するページからお客様の Baidu インデックスを確認したところ、少なくとも4社が同様の問題を抱えていることがわかりました。
何かご提案やアイデアがございましたら、お知らせください。
おそらく百度は中国国内にホストされたサイトを好むのでしょうか?百度は地域限定の検索エンジンであり、もちろん他のリソースも探していますが、主な任務は高品質なローカル検索です。したがって、はっきりとは言えません。これについては少し調査が必要かもしれません。地域がどのように影響するかです。もしかすると百度には他の特別な要件があるかもしれません。
百度がページを取得し、ご指摘の通りすべて問題ない場合、内部のランキングメカニズムが機能する可能性があります。これはソフトウェア依存ではないかもしれません。
バイパス速度も多くの要因に依存します。例えば、情報の関連性、更新頻度、他サイトからのバックリンクの投稿速度とその頻度などです。
なぜ百度に相談しないのでしょうか?おそらく、あなたのサイトのコンテンツ(および必須の登録電話番号)が中国語のみだからではないでしょうか。もしそうであれば、予想される結果が得られるのは当然です。
あなたのサイトの URL が不明なためこれは推測に過ぎませんが、百度は以下の要素を優先することが分かっています(これら以外にも):
- 他の言語よりも簡体字中国語
- 中国国外のホスティングよりも中国国内のホスティング
- 中国のトップレベルドメイン、つまり .cn サイト
そのため、英語で構成され、中国国外にホスティングされ、中国のドメインを持たない Discourse の顧客サイトを参考にしても意味がありません。
@Stranik @Remah
ご返信ありがとうございます。
ウェブサイトの URL は非公開ではありません – https://forum.cuba-platform.cn/ です。
ドメインは .cn であり、サーバーは香港にあり、使用されている言語は中国語のみです。
おそらく、あなたの問題はすでに解決していると思われます。というのも、あなたのトピックを検索して見つけることができるからです。ただ、予想していたよりも検索結果の順位が少し低いようです。私が検索したトピックは、タイトルを正確に一致させた場合でも、検索結果の2ページ目にありました。
したがって、あなたのサイトがまだ百度からの信頼を十分に得ていない可能性が高いです。あるいは、百度にはあなたのサイトがまだ満たしていない追加の要件があるのでしょうか?
どのクエリを入力して、当社のフォーラムが表示されましたか?私は次のように確認しています:百度検索で「site:forum.cuba-platform.cn」というクエリを入力します。現在、5 つのリンクしか表示されておらず、そのいずれもトピックへのリンクではありません。
一方、百度の推奨事項に従い、cURL を使用して新しい URL を百度にプッシュするツールを実装しました。結果については、改めてご連絡いたします。
おっしゃる通り、トピックはインデックスに登録されていません。百度はトピック一覧ページではトピックのタイトルを検出しますが、トピックページでは検出しません。
なぜ百度がトピック一覧をインデックス登録する一方で、トピック自体は登録しないのかはわかりません。これは、クローラーがあなたのサイトを巡回しているものの、トピックページを巡回していないことを意味します。まずはサイトの設定を確認することをお勧めします。
同じ問題があります。
