Los temas del foro no son indexados por Baidu

Hola. Tenemos una versión en chino de nuestro sitio web, pero, lamentablemente, los temas del foro no son indexados por Baidu. He notado que este foro sí es indexado por Baidu sin ningún problema. La pregunta es tanto para los administradores de este foro como para los miembros de la comunidad que lanzaron un foro en chino: ¿Qué han hecho para que Baidu indexe los temas?

¿Cuánto tiempo lleva tu foro? La indexación toma tiempo, dependiendo del motor de búsqueda. ¿Has bloqueado algún rastreador específico mediante la configuración del sitio blacklisted crawler user agents?

El foro se lanzó en abril, así que supongo que no es esa la razón. La configuración de los rastreadores en lista negra es la misma que en tu captura de pantalla. Además, no hay restricciones en robots.txt para el bot de Baidu.

¿Qué dice el motor de búsqueda Baidu sobre esto? Por lo que sé, solía haber una sección (ziyuan.baidu) donde podías obtener información detallada sobre el estado de tu sitio agregado a Baidu.

Discourse no requiere ajustes adicionales para la indexación. Si el escáner no está en la lista negra, no debería haber problemas.

Actualización sobre el tema. Hemos creado una cuenta en ziyuan.baidu.com. No parece haber ningún problema con ella. El rastreador obtiene correctamente el contenido de las páginas. Además, hemos implementado registros en el servidor. Baidu realiza decenas de solicitudes diarias a las páginas de temas, recibiendo una respuesta del servidor con código 200.

Otra cosa interesante: no estamos solos. Verifiqué el índice de Baidu para sus clientes desde la página correspondiente. Al menos 4 de ellos presentan problemas similares:

Por favor, indíquenos si tienen alguna idea al respecto.

¿Quizás Baidu prefiere sitios alojados en China? Baidu es un buscador regional; por supuesto, busca otros recursos, pero su tarea principal es ofrecer una búsqueda local de alta calidad. Así que es difícil decirlo. Quizás necesites investigar un poco al respecto: cómo afecta la región a esto. ¿Tal vez Baidu tiene otros requisitos especiales?

Si Baidu recibe la página y, como mencionas, todo está bien, entonces podrían entrar en juego los mecanismos internos de clasificación, los cuales pueden no depender del software.

La velocidad de indexación también depende de muchos factores. Por ejemplo, la relevancia de la información, la frecuencia de las actualizaciones, la velocidad de publicación de enlaces entrantes y su frecuencia desde otros sitios, etc.

¿Por qué no hablarías de esto con Baidu? Quizás sea porque solo el contenido de tu sitio (y el número de teléfono requerido para el registro) está en chino. Si es así, entonces has obtenido el resultado que yo esperaría.

Esto es solo una especulación sin la URL de tu sitio, pero sabemos que Baidu prioriza, entre otras cosas:

  • el chino simplificado sobre otros idiomas
  • los sitios alojados en China sobre los alojados fuera de China
  • los dominios de nivel superior chinos, es decir, sitios .cn

Por eso no sirve de nada examinar los sitios de clientes de Discourse que están en inglés, alojados fuera de China y sin un dominio .cn.

@Stranik @Remah
Gracias por sus respuestas.
La URL del sitio web no es un secreto: https://forum.cuba-platform.cn/.
Está en el TLD .cn, el servidor está en Hong Kong y solo se utiliza el idioma chino.

Supongo que tu problema ya se ha resuelto, ya que puedo buscar tus temas y encontrarlos. Simplemente aparecen un poco más abajo en los resultados de búsqueda de lo que esperaba: los que busqué estaban en la página 2 de los resultados, incluso con el texto exacto del título del tema.

Por lo tanto, es muy probable que tu sitio aún no tenga suficiente reputación ante Baidu. ¿O es que Baidu tiene algún otro requisito que tu sitio aún no ha cumplido?

¿En qué consultas ingresaste donde se presenta nuestro foro? Yo lo verifico así: ingresa la consulta site:forum.cuba-platform.cn en la búsqueda de Baidu. Ahora veo solo 5 enlaces y ninguno de ellos apunta a temas.

Mientras tanto, seguimos las recomendaciones de Baidu e implementamos una herramienta que envía las nuevas URL a Baidu usando cURL. Regresaremos con los resultados en breve.

Tienes razón en que los temas no se están indexando. Baidu encuentra los títulos de los temas en las vistas de la lista de temas, pero no en la vista del tema.

No sé por qué Baidu indexaría una lista de temas pero no un tema individual. Esto significa que el rastreador está funcionando en tu sitio, pero no está rastreando los temas. Por lo tanto, te recomendaría revisar primero la configuración de tu sitio.

Tenemos el mismo problema.