Keine Onebox-Funktion für Amazon.co.uk (aber amazon.com funktioniert)

Hallo zusammen,

wir laufen Discourse v2.4.0.beta6+119

Wir können keine Onebox-Links zu Produkten auf amazon.co.uk erstellen.

Beispiel (dies funktioniert hier übrigens): Amazon.co.uk

Links zu amazon.com (und anderen Amazon-TLDs) lassen sich ohne Probleme als Onebox anzeigen.

In der Browserkonsole wird ein 404 Not Found-Fehler angezeigt:

Ich habe den Vimeo-IP-Blocklist-Test durchgeführt, falls Amazon ebenfalls eine Reihe von Digital-Ocean-IP-Adressen blockiert hat. Seltsamerweise kann ich den Link jedoch direkt vom Server aus mit wget problemlos abrufen:

xx@xx:~# wget https://www.amazon.co.uk/BG-Electrical-NBS22G-Brushed-Switched/dp/B004TRJYE8
--2019-10-23 14:49:47--  https://www.amazon.co.uk/BG-Electrical-NBS22G-Brushed-Switched/dp/B004TRJYE8
Resolving www.amazon.co.uk (www.amazon.co.uk)... 99.86.105.85
Connecting to www.amazon.co.uk (www.amazon.co.uk)|99.86.105.85|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: unspecified [text/html]
Saving to: âB004TRJYE8â

B004TRJYE8                                            [   <=          ] 711.64K   682KB/s    in 1.0s

2019-10-23 14:49:48 (682 KB/s) - âB004TRJYE8â saved [728716]

Habt ihr Vorschläge, was ich als Nächstes versuchen könnte? :thinking:

Aus meiner Erfahrung wird Amazon Sie sehr schnell sperren, wenn Sie es häufig kontaktieren. Das ist ebenfalls automatisiert.

Unsere Mitglieder stoßen in letzter Zeit häufig darauf, besonders da wir mit Amazon UK und Amazon France verbunden sind.

Die Möglichkeit, per Onebox relevante Produkte zur Diskussion anzuzeigen, hilft uns natürlich, da unsere Forumsfonds steigen, wenn ein Artikel über den Affiliate-Link gekauft wird.

Dass die Onebox nun nicht mehr angezeigt wird, ist jedoch übertrieben und hilft niemandem. Ich habe seitdem diesen Thread von @merefield gefunden:

Seien Sie vorsichtig beim Oneboxing von Amazon.

Ich wurde wegen dieses „Verstoßes

Danke, Robert. Die Warnung wurde zur Kenntnis genommen und weitergegeben.

Rechtlich verstößt das gegen ihre Nutzungsbedingungen, aber ich stimme Jeff zu: Die Zeit, in der ich „bestraft

Wie bei Amazons Verkäufer-Support hängt alles davon ab, wer Ihre Anfrage oder in diesem Fall Ihren Antrag erhält, um welche Antwort Sie erhalten!

Die Betriebsvereinbarung des Amazon-Partnerprogramms wurde kürzlich aktualisiert: am 6. September 2019 (UK) und am 1. Oktober auf .com.

Wie immer behalten sie sich das Recht vor, „jeden Teil der Vertragsbedingungen zu ändern“ (Abschnitt 13), und wenn es Ihnen nicht gefällt … nun, dann gehen Sie einfach (Abschnitt 6) … sie sind eine wahre Freude, mit ihnen zu arbeiten!

https://affiliate-program.amazon.co.uk/help/operating/agreement

Wir sind keine Amazon-Affiliates, und auch keine unserer Mitglieder, die Links zu Amazon-Produkten in unserem Discourse veröffentlichen.

Unsere Mitglieder veröffentlichen manchmal Links zu Produkten auf Amazon, die für unsere Community von Interesse sein könnten, aber das wird nicht sehr häufig vorkommen. Ich würde sagen, im Durchschnitt ist es so wenig wie ein Amazon-Link pro Tag. Wir missbrauchen das System also nicht wirklich.

Ich bin immer noch nicht ganz sicher, warum ich die URL direkt vom Server mit wget abrufen kann, ohne dass ein Problem auftritt :thinking:

Gibt es noch etwas anderes, das ich versuchen oder testen könnte? Gibt es Caches, die ich leeren oder Prozesse, die ich neu starten könnte, um etwas zu ‘aktualisieren’?

Die Lage wird undurchsichtig / die Verwirrung hält an…

Habt ihr eine Ahnung, was hier los ist? :thinking:

Die erste URL zeigt eine Vorschau an, wenn auch mit der Meldung „Robot Check

Übrigens erscheint die Meldung Robot Check hier auf Meta nicht, sondern nur eine leere Onebox:

Robot Check bedeutet, dass Sie als Bot blockiert wurden.

Nicht gut :confused:

Da ich die Seite vom Server selbst mit wget problemlos abrufen kann, ist es keine vollständige IP-Sperre wie bei Vimeo. Wissen wir also, wie sie diese Prüfung durchführen?

Gibt es Tipps für eine Umgehung? :thinking:

Irgendwie wurdest du als unerwünscht identifiziert. Es ist sehr üblich, dass VP-Server vom Scraping blockiert werden. Du benötigst einen Proxy-Crawling-Dienst.

Ich unterstütze einen in meinem Plugin: Onebox Assistant

Danke für den Vorschlag. Ein kurzer Blick deutet darauf hin, dass ich ein kostenpflichtiges Abonnement abschließen muss, damit das funktioniert. Gibt es andere Workarounds, die ich nutzen könnte?

Mich interessiert, wie Amazon erkennt, dass Discourse die Anfrage stellt, und diese in Echtzeit blockiert, während die wget-Methode auf demselben Server weiterhin einwandfrei funktioniert.

Wahrscheinlich die User-Agent-Zeichenkette.

Was zeigt Discourse als sein User-Agent an?

Könnte ich das manipulieren, um es wie einen regulären Firefox-Browser oder ähnliches aussehen zu lassen? :thinking: