Nos utilisateurs se plaignent que Onebox est cassé pour certains sites récemment, y compris le New York Times et le Washington Post. Est-ce que Onebox a changé récemment ? Voir les liens ci-dessous. Le premier est un lien cadeau.
J’ai remarqué un certain nombre d’URL directes publiées récemment, j’ai pensé que c’était les sites, mais maintenant je me demande si c’est plus que ça
J’ai récemment ajouté la prise en charge des onebox GitHub privés, mais cela ne devrait pas affecter les autres sites. En général, nous ne pouvons pas faire de onebox pour les sites privés / derrière un paywall :
J’ai récemment remarqué des comportements étranges sur Stable. Lorsque je publie des liens de mes autres instances Discourse (Tests-réussis), le lien ne fait parfois pas toujours de onebox, apparemment de manière aléatoire.
Je n’ai pas essayé de publier des liens de mon stable sur le forum des tests réussis.
J’ai essayé de reconstruire le HTML sans succès pour que le lien fasse une onebox.
Je pense que si je me souviens bien, il y a un autre sujet ici (sur Meta) où j’ai posté une capture d’écran.
Le New York Times et le Washington Post ont toujours été des publications payantes. Bien que je ne sache pas s’ils ont récemment modifié leur structure de paywall.
Cependant, si je peux faire une suggestion : si le paywall est le problème, et si l’on peut voir visuellement le titre de l’article et la légende sur la page payante, ne devrait-il pas être possible pour onebox de capturer ces informations ?
Oui, je ne suis pas vraiment en désaccord avec ça, j’ai regardé la source de la page et j’ai l’impression que nous avons suffisamment d’informations pour montrer quelque chose.
Le New York Times a instauré un péage en 2011. Mais il autorisait parfois la lecture de quelques articles sans inscription ni carte de crédit, cinq si je me souviens bien. Dans le même temps, il autorisait la navigation de Google. Un système beaucoup plus récent bloque totalement l’accès et, après s’être battu avec Google, ils ont totalement fermé la lecture gratuite.
La rupture de l’oneboxing a-t-elle pu se produire en même temps ?
95 % de chances que le onebox fasse déjà cela. S’il y a suffisamment d’informations pour afficher un onebox, il le fera, même si le contenu est finalement payant.
Je pense que ce qui se passe, c’est que le onebox est mis sur liste noire par ces sites web payants en raison des récents robots/agents d’IA générative, de sorte qu’il ne voit pas le même HTML que nous pourrions voir en utilisant un navigateur.
Cependant, je serais heureux d’avoir tort. Si quelqu’un veut jeter un coup d’œil rapide pour voir s’il peut l’améliorer d’une manière ou d’une autre, pr-welcome
1 « J'aime »
j.jaffeux
(Joffrey Jaffeux)
A fermé ce sujet ()
17
Ce sujet a été automatiquement fermé 30 jours après la dernière réponse. Les nouvelles réponses ne sont plus autorisées.