Oneboxing durch Roboterprüfung blockiert

Ich sehe dies auf einer Website, und es hat gerade erst begonnen. Wenn Discourse versucht, die Informationen von der Website abzurufen, wird der Zugriff blockiert. Dies hat in früheren Versionen funktioniert.

Ich habe einen Link als Beispiel hinzugefügt:

Bloomberg – Sind Sie ein Roboter?

Es scheint sich um eine Ratenbegrenzung durch Bloomberg zu handeln. Wahrscheinlich können Sie nicht viel tun, als die Grenzen abzuleiten und darauf zu achten, sie nicht zu überschreiten.

Was genau versuchst du hier zu oneboxen? Die URL ist ziemlich seltsam.

Bloomberg-Nachrichtenartikel. Wenn Sie auf den Link klicken, gelangen Sie zum Artikel.

Versuche es mit "Onebox Assistant", crawl for those previews reliably!

Soweit ich mich erinnere, funktioniert das auch mit Bloomberg-Links.

Was ist der ursprüngliche Link? Der oben von dir eingefügte ist kein Artikel, sondern meiner Vermutung nach eine Weiterleitungsziel.

https://www.bloomberg.com/opinion/articles/2020-01-29/peer-review-is-science-s-wheel-of-misfortune

Dies ist der Link.

Verstehe, hier ist der Link

http://www.bloomberg.com/opinion/articles/2020-01-29/peer-review-is-science-s-wheel-of-misfortune

http://www.bloomberg.com/opinion/articles/2020-01-29/peer-review-is-science-s-wheel-of-misfortune

Anscheinend haben sie ziemlich aggressive Anti-Scraping-Maßnahmen implementiert, da wir nur auf Metadaten-Header prüfen..

Auch ein weiteres Beispiel dafür, dass wir überhaupt keine Oneboxing-Funktion verwenden sollten, da wir weder ein Bild noch eine Beschreibung haben cc @techAPJ @sam .. Wir müssen diese Änderung unbedingt, sobald sie nächste Woche eingeführt wird, auch auf die stabile Version zurückportieren.

Ich habe gerade den Link mit der html-Erweiterung ausprobiert (ohne alle nachgestellten Zeichen), und zwar ausschließlich mit Firefox, nicht mit Discourse Onebox. Die detaillierte Fehlermeldung befindet sich unter der Linie. Der erste Link (bei dem die Fehlermeldung unten steht) ist hier in < > eingeschlossen. Der zweite Link ist ohne < > und zeigt den Titel der URL wie dargestellt.
https://www.bloomberg.com/tosv2.html
Bloomberg - Are you a robot?


Wir haben ungewöhnliche Aktivitäten in Ihrem Computernetzwerk festgestellt

Um fortzufahren, klicken Sie bitte auf das Feld unten, um uns mitzuteilen, dass Sie kein Roboter sind.

Warum ist das passiert?

Stellen Sie bitte sicher, dass Ihr Browser JavaScript und Cookies unterstützt und dass Sie deren Laden nicht blockieren. Weitere Informationen finden Sie in unseren Nutzungsbedingungen und unserer Cookie-Richtlinie.

Hilfe benötigt?

Bei Anfragen zu dieser Meldung kontaktieren Sie bitte unser Support-Team und geben Sie die unten stehende Referenz-ID an.

Block-Referenz-ID: 13215fd0-4285-11eb-8faf-b7e9262e99b2