Olá. Temos uma versão chinesa do nosso site, mas, infelizmente, os tópicos do fórum não estão sendo indexados pelo Baidu. Notei que este fórum é indexado pelo Baidu sem problemas. A pergunta é tanto para os administradores deste fórum quanto para os membros da comunidade que lançaram um fórum em chinês: o que vocês fizeram para que o Baidu indexasse os tópicos?
O fórum foi lançado em abril, então acho que não é esse o motivo. As configurações de rastreadores na lista negra são as mesmas que aparecem na sua captura de tela. Além disso, não há restrições no robots.txt para o robô do Baidu.
O que o mecanismo de busca Baidu diz sobre isso? Até onde sei, havia uma seção (ziyuan.baidu) onde você podia obter informações detalhadas sobre o status do seu site adicionado ao Baidu.
O Discourse não requer ajustes adicionais para indexação. Se o scanner não estiver na lista negra, não deve haver problemas.
Atualização sobre o assunto. Criamos uma conta em ziyuan.baidu.com. Nada parece estar errado com ela. O crawler obtém o conteúdo da página corretamente. Além disso, implementamos logs no servidor. O Baidu faz dezenas de requisições por dia para páginas de tópicos, com resposta 200 do servidor.
Mais uma coisa interessante: não estamos sozinhos. Verifiquei o índice do Baidu para seus clientes a partir da página correspondente. Pelo menos quatro deles apresentam problemas semelhantes:
Por favor, oriente-nos se tiver alguma ideia.
Talvez o Baidu prefira sites hospedados na China? O Baidu é um mecanismo de busca regional; claro, ele procura outros recursos, mas sua principal tarefa é a busca local de alta qualidade. Então, é difícil dizer. Você pode precisar fazer uma pequena pesquisa sobre isso. Como a região afeta isso. Talvez o Baidu tenha alguns outros requisitos especiais?
Se o Baidu receber a página e, como você escreveu, tudo estiver correto, então os mecanismos internos de classificação podem entrar em ação. O que pode não depender do software.
A velocidade de indexação também depende de muitos fatores. Por exemplo, a relevância das informações, a frequência de atualizações, a velocidade de publicação de backlinks e sua frequência a partir de outros sites, etc.
Por que você não levaria isso ao Baidu? Talvez porque apenas o conteúdo do seu site (e o número de telefone necessário para registro) esteja em chinês. Se for esse o caso, então você obteve o resultado que eu esperaria.
Isso é apenas especulação sem a URL do seu site, mas sabemos que o Baidu prioriza, entre outras coisas:
- chinês simplificado em vez de outros idiomas
- sites hospedados na China em vez de fora da China
- domínios com TLD chinês, ou seja, sites .cn
É por isso que não adianta olhar para sites de clientes do Discourse que estão em inglês, hospedados fora da China e sem um TLD chinês.
@Stranik @Remah
Obrigado pelas suas respostas.
A URL do site não é um segredo – https://forum.cuba-platform.cn/.
Ele está no TLD .cn, o servidor está em Hong Kong e apenas o idioma chinês é utilizado.
Acho que seu problema já foi resolvido, pois consigo pesquisar seus tópicos e encontrá-los. Eles estão apenas um pouco mais abaixo nos resultados da busca do que eu esperava: os que pesquisei estavam na página 2 dos resultados, mesmo com o texto exato do título do tópico.
Portanto, é muito provável que seu site ainda não tenha reputação suficiente junto ao Baidu. Ou o Baidu tem algum outro requisito que seu site ainda não cumpriu?
Em quais consultas você digitou onde nosso fórum é apresentado? Eu verifico dessa forma: digito a consulta site:forum.cuba-platform.cn na busca do Baidu. Agora vejo apenas 5 links e nenhum deles é um link para tópicos.
Enquanto isso, seguimos as recomendações do Baidu e implementamos uma ferramenta que envia novos URLs para o Baidu usando cURL. Retornaremos com os resultados em breve.
Você tem razão de que os tópicos não estão sendo indexados. O Baidu encontra os títulos dos tópicos nas visualizações da lista de tópicos, mas não na visualização do tópico.
Não sei por que o Baidu indexaria uma lista de tópicos, mas não um tópico. Isso significa que o crawler está acessando seu site, mas não está percorrendo os tópicos. Portanto, recomendo verificar primeiro a configuração do seu site.
Nós temos o mesmo problema.
