Hallo!
Es sieht so aus, als ob die Google Search Console eine der Sitemaps nicht lesen kann. Die Hauptsitemap sitemap.xml (https://forum.pragmaticentrepreneurs.com/sitemap.xml) wird korrekt gelesen, aber nur sitemap_recent.xml wird importiert.
Wenn ich versuche, sitemap_1.xml selbst zur Google Search Console hinzuzufügen, erhalte ich eine Fehlermeldung. Wenn ich es im Validator versuche, sieht es gut aus.
Haben Sie eine Idee, warum GSE sitemap_1.xml nicht lesen kann?
Vielen Dank für Ihre Hilfe.
EDIT:
Bing liest beide Sitemaps korrekt, es scheint also spezifisch für Google zu sein.
Außerdem ist alles in Ordnung, wenn ich versuche, sitemap_1.xml zu inspizieren.
Es sieht so aus, als hätten Sie letztes Jahr dasselbe Problem gehabt: Troubleshooting sitemap indexing issues in Google Search Console.
Hat es am Ende funktioniert?
Ich habe gerade gesehen, dass ich bereits eine Frage dazu gepostet habe
Aber nein, ich habe keine Lösung gefunden.
Lassen Sie mich wissen, ob ich weitere Informationen zur Verfügung stellen kann, um zu helfen.
Ich habe auch keine Ahnung.
Die URL ist für mich zugänglich. Ich habe verschiedene Tools verwendet, um das XML zu validieren, kein Problem. Wenn Sie diesen Artikel lesen: Manage your sitemaps using the Sitemaps report - Search Console Help, sollten Sie unter dem Fehler eine Detailseite sehen, die Ihnen sagt, was falsch ist (sieht bei Ihnen aber nicht so aus).
Zumindest würde ich Sie ermutigen, diesen Artikel zu lesen. Vielleicht finden Sie einen Hinweis.
Tatsächlich habe ich keine Details zu dem Fehler. Ich habe versucht, die URL zu inspizieren, wie sie sagten, aber hier gibt es keinen Fehler :(\n\nLassen Sie mich wissen, wenn ich sonst noch etwas tun kann, um zu helfen.
Update
Ich habe den korrekten Sitemap-Endpunkt gefunden und er verhält sich für Googlebot normal:
https://forum.pragmaticentrepreneurs.com/sitemap.xml
Es handelt sich um einen gültigen Sitemap-Index, der verweist auf:
https://forum.pragmaticentrepreneurs.com/sitemap_recent.xml
https://forum.pragmaticentrepreneurs.com/sitemap_1.xml
Was ich getestet habe
- Googlebot-Zugriff:
sitemap.xml, sitemap_recent.xml und sitemap_1.xml geben alle HTTP/2 200 mit einem Googlebot-User-Agent zurück, und der Body ist echtes XML (keine HTML-Herausforderungsseite).
- Header / Content-Type:
sitemap.xml: Content-Type: application/xml; charset=utf-8
sitemap_recent.xml + sitemap_1.xml: Content-Type: text/xml; charset=utf-8
- Die Antworten enthalten
x-discourse-route: sitemap/* und x-discourse-crawler-view: true (von Discourse im Crawler-Modus bereitgestellt).
- IPv4 + IPv6: Beide geben 200 für
sitemap.xml zurück.
- Stabilität: Ich habe jede Sitemap 20 Mal hintereinander mit einem Googlebot UA abgerufen – keine 403/429/5xx.
- Die typischen Antwortzeiten lagen bei ca. 0,17–0,28s für
sitemap.xml, ca. 0,19–0,60s für sitemap_recent.xml und meistens ca. 0,45–0,99s für sitemap_1.xml (eine langsamere Antwort bei ca. 2,9s, immer noch 200).
- robots.txt: Enthält
Sitemap: https://forum.pragmaticentrepreneurs.com/sitemap.xml und blockiert /sitemap*.xml nicht.
Search Console Status
In der Google Search Console wird die Verarbeitung des Sitemap-Index als erfolgreich angezeigt, aber nur https://forum.pragmaticentrepreneurs.com/sitemap_recent.xml wird derzeit unter „Gelesene Sitemaps“ aufgeführt/erkannt.
sitemap_1.xml ist dort immer noch nicht aufgeführt.
Wo wir jetzt stehen
Auf Serverseite sieht alles in Ordnung aus, daher fühlt es sich nach einer Verzögerung oder teilweisen Verarbeitung auf Seiten der Search Console an: Google liest den Index und mindestens eine untergeordnete Sitemap, hat aber die zweite noch nicht in der Benutzeroberfläche angezeigt.