Bonjour,
nous avons récemment déployé Anubis sur notre serveur pour nous protéger contre les robots d’IA gourmands en ressources. Il envoie une page statique avec le titre « Vérification que vous n’êtes pas un robot ! » aux requêtes envoyées avec des agents utilisateurs similaires à ceux des navigateurs, effectue une preuve de travail JavaScript, puis redirige vers la page appropriée. Les agents utilisateurs qui n’ont pas « Mozilla » dans leur nom peuvent accéder directement à la page.
Maintenant, les aperçus de liens onebox de Discourse sont cassés, mais uniquement pour les liens inline.
En examinant les journaux du serveur, Discourse envoie deux types d’agents utilisateurs différents :
-
Discourse Forum Onebox v3.4.1pour les grands aperçus de liens onebox (voirlib/onebox/helpers.rb#L217-L226dans03f3e84ce520d375aa1c66bb0e95cc5ed9832776) -
Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/14.0 Safari/605.1.15pour les aperçus de liens inline (voirlib/final_destination.rb#L40dans03f3e84ce520d375aa1c66bb0e95cc5ed9832776)
J’ai essayé « Forcer l’agent utilisateur onebox personnalisé pour certains hôtes » dans les paramètres d’administration, ce qui prétend que « Les hôtes pour lesquels utiliser l’agent utilisateur onebox personnalisé sur toutes les requêtes. », mais cela n’a fait aucune différence.
J’ai également testé la modification du paramètre caché onebox_user_agent, mais cela ne change que l’agent utilisateur de l’aperçu de lien onebox régulier, pas celui des liens inline.
Cela ressemble à un bug, ne serait-il pas plus logique d’utiliser le même agent utilisateur configurable Discourse Forum Onebox pour les aperçus de liens inline également ?
Merci !