Como usar o sitemap corretamente?

Olá. Alguém pode me esclarecer como usar o sitemap do Discourse da maneira correta?
Nas configurações do Discourse, habilitei o sitemap:

Este é o conteúdo do meu arquivo sitemap:

<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>https://*******/sitemap_recent.xml</loc>
<lastmod>2024-08-13T00:43:48Z</lastmod>
</sitemap>
<sitemap>
<loc>https://******/sitemap_1.xml</loc>
<lastmod>2024-08-13T00:43:48Z</lastmod>
</sitemap>
</sitemapindex>

Adicionei este sitemap ao GSC e parece que este arquivo foi importado com sucesso, mas ele sempre mostra apenas uma página encontrada:

Se eu tentar adicionar ao GSC o arquivo sitemap_1.xml, que na verdade contém todas (ou muitas) das minhas páginas, o GSC não o importa com um erro.

Então… qual é a maneira correta de ajudar o GSC a indexar meu site? Ou eu não preciso fazer nada e o Google importa o sitemap ao verificar o arquivo robot.txt e, posteriormente, terei apenas que esperar?

Ei, qual URL você está colocando no GSC? seudominio/sitemap.xml?

[quote=“David_Ghost, post:2, topic:321496”]nyourdomain/sitemap.xml?
[/quote]
Obrigado! Sim, acho que sim ))
Preenchi o formulário no GSC, assim:


e acho que isso significa que o nome de domínio foi incluído.
Da mesma forma, tentei adicionar sitemap_1.xml:

e não funcionou.

Tente com httpS

https://wedframe.ru/sitemap.xml

2 curtidas

Obrigado novamente, David! Não sabia que no GSC era preciso adicionar http e https separadamente. Adicionei este domínio ao GSC há muitos anos, quando os certificados praticamente não eram usados em lugar nenhum. Aparentemente, por esse motivo, não foi possível usar o endereço httpS no formulário de adição do sitemap. Mas isso não é um problema. Agora adicionei meu recurso novamente e posso usar httpS neste formulário.

No entanto, no momento, isso também não resolve o problema. Quando abro o processamento de dados deste arquivo, vejo outros dois arquivos de sitemap. E aquele que contém todos os tópicos e categorias ainda não é importado devido a um erro:

Pode haver um problema neste arquivo? Talvez os nomes de tópicos/categorias contenham alguns símbolos incompatíveis que violam a sintaxe xml? Verifiquei no Notepad++ e parece que o xml está correto.

Espere um pouco. Isso se resolverá sozinho. Acontece comigo às vezes. Verifique novamente em meia hora.

Acabei de verificar seu sitemap_1.xml. Parece bom para mim.

2 curtidas

Você não deve usar sitemap_1.xml porque você nunca sabe quantos sub-sitemaps você terá. Use apenas um sitemap simples.

2 curtidas

Sim. Neste momento, adiciono apenas o arquivo sitemap.xml. Os arquivos sitemap_1.xml e sitemap_recent.xml aparecem no GSC por conta própria, conforme entendo, após o escaneamento do conteúdo do arquivo sitemap.xml pelo Google.

Parece que algo deu errado entre sitemap_1.xml e o GSC. Neste momento (após quase dois dias), este arquivo ainda apresenta erro e, ao mesmo tempo, o Yandex importa este arquivo sem problemas.

sitemap.xml importado com sucesso

também seguiu sitemap_recent.xml com sucesso, mas sitemap_1.xml está “Não recebido”

Então, verifico este arquivo em validação de URL e parece que tudo está ok:

mágica…

Ainda não consigo entender por que você está enviando _1 e recent quando deveria usar apenas sitemap.xml.

Basta olhar o conteúdo do arquivo sitemap.xml e você entenderá.
Eu envio APENAS sitemap.xml, e os arquivos sitemap_recent.xml e sitemap_1.xml são adicionados automaticamente como resultado do Google rastrear o conteúdo do arquivo sitemap.xml.
Tenho certeza de que isso foi intencional pelos desenvolvedores do Discourse, porque o arquivo sitemap.xml NÃO contém nenhuma informação sobre tópicos e categorias, ele APENAS contém links para esses dois arquivos, que por sua vez contêm informações sobre tópicos e categorias.
Ou seja, em última análise, rastrear o arquivo sitemap.xml leva o Google a importar sitemap_recent.xml e sitemap_1.xml.

Minha falha. Claro que eu quis dizer sitemap_index.xml. E o seu único propósito é guiar o googlebot para sub-sitemaps. É por isso que você não informa a localização de sitemap_x.xml (porque pode haver vários e você nunca sabe quantos) e sitemap_recent.xml.

Você deve enviar apenas o sitemap índice, nada mais. Basicamente, você está perdendo seu tempo tentando enviar sitemaps que o Google não precisa nem quer.

De novo…
É exatamente isso que eu faço. Eu envio apenas sitemap.xml e não sitemap_x.xml e não sitemap_recent.xml, mas esses arquivos aparecem no GSC depois que eu envio apenas sitemap.xml
E não há sitemap_index.xml.

Bem… por que você está perguntando isso se não os está usando :flushed_face:

Acho que você não entendeu a essência de como o Google funciona com o arquivo sitemap.xml do Discourse e, portanto, faz a mesma pergunta em um círculo. O próprio Google importa esses arquivos após escanear o arquivo sitemap.xml, mas no meu caso o arquivo sitemap_recent.xml é importado com sucesso, e o arquivo sitemap_x.xml é importado com um erro.

Eu sei muito bem, mas:

  • esse sitemap “quebrado” não é do Google, você o enviou mesmo sem dever
  • o círculo vem da sua pergunta; mesma pergunta, mesma resposta toda vez

Enfim. Você ainda está perdendo seu tempo.

Eu te disse muitas vezes. Eu NÃO envio nada além de sitemap.xml. O que mais posso fazer por você, preste atenção nisso? Preciso gravar um vídeo?? Ou mais?

Eu acho que é só você que está perdendo meu tempo. É melhor não tentar me “ajudar”, por favor :open_hands:

Olá,

Você pode excluir o sitemap completamente e reenviar mais uma vez?

Eu verifiquei este mais uma vez e notei que o sitemap leva vários segundos para carregar corretamente. Mas acho que isso tem a ver com seus 6 mil threads.

Eu tentei ajudar como pude e acho que tudo parece normal para mim. Você tem outros sitemaps nestas contas do GSC?

É uma propriedade de domínio ou um prefixo de URL? Se for um prefixo de URL, tente com uma propriedade de domínio.

1 curtida

Ok. Eu excluo o sitemap:

e envio mais uma vez:

O Google diz - está tudo certo

E agora, quando clico neste sitemap.xml recém-enviado, vejo dois novos arquivos e ainda há um arquivo com o erro “Não recebido”


Lembro que, ao mesmo tempo, outro mecanismo de busca (yandex) aceitou o mesmo sitemap.xml sem problemas e depois leu o conteúdo do arquivo sitemap_1.xml sem problemas.
Então… o problema está em algum lugar entre o Google e este sitemap.

Neste momento não. Anteriormente, nesta conta, havia um sitemap criado no vbulletin. E não houve problemas com ele. Mas, no momento, excluí o sitemap antigo.

Primeiro tentei com URL, mas depois usei um domínio.

Isso me parece estranho. Não consigo ver nenhum problema. Tudo está correto. Espero que outra pessoa aqui lhe traga uma solução. Não consigo mais ver o que está errado.

1 curtida