Les sujets du forum ne sont pas indexés par Baidu

Bonjour. Nous avons une version chinoise de notre site web, mais malheureusement, les sujets du forum ne sont pas indexés par Baidu. J’ai remarqué que ce forum est indexé par Baidu sans aucun problème. Ma question s’adresse à la fois aux administrateurs de ce forum et aux membres de la communauté qui ont lancé un forum en chinois. Qu’avez-vous fait pour que Baidu indexe les sujets ?

Quel âge a votre forum ? L’indexation prend du temps, selon le moteur de recherche. Avez-vous blacklisté des robots d’exploration spécifiques via le paramètre du site « blacklisted crawler user agents » ?

Le forum a été lancé en avril, donc je suppose que ce n’est pas la raison. Les paramètres des robots d’exploration mis sur liste noire sont identiques à ceux de votre capture d’écran. De plus, il n’y a aucune restriction dans le fichier robots.txt pour le robot Baidu.

Que dit le moteur de recherche Baidu à ce sujet ? À ma connaissance, il existait autrefois une section (ziyuan.baidu) où vous pouviez obtenir des informations détaillées sur l’état de votre site ajouté à Baidu.

Discourse ne nécessite aucun réglage supplémentaire pour l’indexation. Si le scanner n’est pas blacklisté, il ne devrait y avoir aucun problème.

Mise à jour sur le sujet. Nous avons créé un compte sur ziyuan.baidu.com. Rien ne semble incorrect de ce côté. Le crawler récupère correctement le contenu des pages. De plus, nous avons mis en place des journaux d’activité sur le serveur. Baidu effectue plusieurs dizaines de requêtes par jour sur les pages de sujets, avec des réponses serveur 200.

Une autre information intéressante : nous ne sommes pas seuls. J’ai consulté l’index Baidu pour vos clients à partir de la page correspondante. Au moins quatre d’entre eux rencontrent des problèmes similaires :

Merci de nous faire part de vos idées si vous en avez.

Peut-être que Baidu préfère les sites hébergés en Chine ? Baidu est un moteur de recherche régional ; bien sûr, il recherche d’autres ressources, mais sa tâche principale est d’offrir une recherche locale de haute qualité. Il est donc difficile de se prononcer. Vous devrez peut-être faire quelques recherches à ce sujet pour comprendre comment la région influence cela. Peut-être que Baidu a d’autres exigences particulières ?

Si Baidu parvient à accéder à la page et que tout semble correct, comme vous l’indiquez, des mécanismes internes de classement pourraient entrer en jeu. Ceux-ci ne dépendent pas nécessairement du logiciel.

La vitesse de contournement dépend également de nombreux facteurs. Par exemple, la pertinence des informations, la fréquence des mises à jour, la rapidité d’obtention de liens retour et leur fréquence depuis d’autres sites, etc.

Pourquoi ne pas en parler directement à Baidu ? Peut-être parce que seul le contenu de votre site (ainsi que le numéro de téléphone requis pour l’inscription) est en chinois. Dans ce cas, vous obtenez le résultat que j’aurais prévu.

Il s’agit simplement d’une spéculation sans connaître l’URL de votre site, mais nous savons que Baidu donne la priorité, entre autres, aux éléments suivants :

  • le chinois simplifié par rapport aux autres langues
  • les sites hébergés en Chine par rapport à ceux hébergés à l’extérieur
  • les domaines de premier niveau chinois, c’est-à-dire les sites .cn

C’est pourquoi il est inutile d’examiner les sites clients de Discourse qui sont en anglais, hébergés hors de Chine et sans domaine de premier niveau chinois.

@Stranik @Remah
Merci pour vos réponses.
L’URL du site web n’est pas un secret – https://forum.cuba-platform.cn/.
Il utilise le TLD .cn, le serveur est situé à Hong Kong et seule la langue chinoise y est utilisée.

Je suppose que votre problème est maintenant résolu, car je peux rechercher vos sujets et les trouver. Ils se situent simplement un peu plus bas dans les résultats de recherche que prévu : ceux que j’ai recherchés apparaissaient à la page 2 des résultats, même avec le texte exact du titre du sujet.

Il est donc très probable que votre site n’ait pas encore une réputation suffisante auprès de Baidu. Ou bien Baidu impose-t-il une autre exigence que votre site n’a pas encore satisfaite ?

Quelles requêtes avez-vous saisies pour que notre forum apparaisse ? Je procède ainsi : je saisis la requête site:forum.cuba-platform.cn dans la recherche Baidu. Pour l’instant, je ne vois que 5 liens, et aucun ne pointe vers des sujets.

Pendant ce temps, nous avons suivi les recommandations de Baidu et mis en place un outil qui soumet les nouvelles URL à Baidu en utilisant cURL. Nous reviendrons vers vous avec les résultats dans un instant.

Vous avez raison, les sujets ne sont pas indexés. Baidu repère les titres des sujets dans les vues de la liste des sujets, mais pas dans la vue du sujet lui-même.

Je ne sais pas pourquoi Baidu indexerait une liste de sujets mais pas un sujet. Cela signifie que le robot d’exploration fonctionne sur votre site, mais n’explore pas les sujets. Je vous recommande donc de vérifier d’abord la configuration de votre site.

Nous avons le même problème.