Unsere Nutzer beschweren sich, dass Onebox kürzlich für einige Websites, darunter New York Times und Washington Post, kaputtgegangen ist. Hat sich Onebox kürzlich geändert? Siehe Links unten. Der erste ist ein Geschenk-Link.
Mir ist aufgefallen, dass in letzter Zeit eine Reihe von direkten URLs gepostet wurden. Ich dachte, es läge an den Seiten, aber jetzt frage ich mich, ob es mehr ist
Ich habe kürzlich Unterstützung für private GitHub-Oneboxen hinzugefügt, aber das sollte andere Websites nicht beeinträchtigen. Im Allgemeinen können wir keine Websites mit Paywall / privaten Websites als Onebox anzeigen:
Ich habe in letzter Zeit einige seltsame Verhaltensweisen bei Stable bemerkt. Wenn ich Links von meinen anderen Discourse-Instanzen (Tests-bestanden) poste. Manchmal, scheinbar zufällig, wird der Link nicht immer in einer Onebox angezeigt.
Ich habe noch nicht versucht, Links von meinem Stable auf dem Tests-bestanden-Forum zu posten.
Ich habe versucht, HTML neu zu erstellen, ohne Erfolg, um den Link in einer Onebox anzuzeigen.
Ich glaube, ich erinnere mich, dass es hier (auf Meta) ein weiteres Thema gibt, in dem ich einen Screenshot gepostet habe.
Die New York Times und die Washington Post waren schon immer kostenpflichtige Publikationen. Ich weiß zwar nicht, ob sie in letzter Zeit etwas an ihrer Paywall-Struktur geändert haben.
Wenn ich jedoch einen Vorschlag machen darf: Wenn die Paywall das Problem ist und man den Artikel-Titel und die Bildunterschrift auf der Paywall-Seite visuell sehen kann, sollte Onebox dann nicht in der Lage sein, diese Informationen zu erfassen?
Ja, ich stimme dem eigentlich nicht zu. Ich habe mir den Quellcode der Seite angesehen und es scheint, als hätten wir genügend Informationen, um etwas anzuzeigen.
Die New York Times führte 2011 eine Paywall ein. Sie erlaubte jedoch manchmal, fünf, wenn ich mich recht erinnere, ohne Registrierung und Kreditkarte zu lesen. Gleichzeitig erlaubte sie Googles Browsing. Ein viel neueres System blockiert den Zugang komplett und nach einem Streit mit Google haben sie das kostenlose Lesen komplett eingestellt.
Könnte der Ausfall von Oneboxing zur gleichen Zeit stattgefunden haben?
95% sicher, dass die Onebox das bereits tut. Wenn genügend Informationen vorhanden sind, um eine Onebox anzuzeigen, wird sie dies auf jeden Fall tun, auch wenn der Inhalt letztendlich hinter einer Paywall liegt.
Ich glaube, was passiert, ist, dass die Onebox von diesen Paywall-Websites aufgrund der jüngsten LLM-Crawler/Agenten denylisted wird, sodass sie nicht denselben HTML-Code sieht, den wir beim Surfen im Browser sehen könnten.
Ich lasse mich aber gerne eines Besseren belehren. Wenn jemand einen kurzen Blick darauf werfen möchte, um zu sehen, ob er sie irgendwie verbessern kann, #pr_welcome