Ich habe den Vimeo-IP-Blocklist-Test durchgeführt, falls Amazon ebenfalls eine Reihe von Digital-Ocean-IP-Adressen blockiert hat. Seltsamerweise kann ich den Link jedoch direkt vom Server aus mit wget problemlos abrufen:
Unsere Mitglieder stoßen in letzter Zeit häufig darauf, besonders da wir mit Amazon UK und Amazon France verbunden sind.
Die Möglichkeit, per Onebox relevante Produkte zur Diskussion anzuzeigen, hilft uns natürlich, da unsere Forumsfonds steigen, wenn ein Artikel über den Affiliate-Link gekauft wird.
Dass die Onebox nun nicht mehr angezeigt wird, ist jedoch übertrieben und hilft niemandem. Ich habe seitdem diesen Thread von @merefield gefunden:
Wie bei Amazons Verkäufer-Support hängt alles davon ab, wer Ihre Anfrage oder in diesem Fall Ihren Antrag erhält, um welche Antwort Sie erhalten!
Die Betriebsvereinbarung des Amazon-Partnerprogramms wurde kürzlich aktualisiert: am 6. September 2019 (UK) und am 1. Oktober auf .com.
Wie immer behalten sie sich das Recht vor, „jeden Teil der Vertragsbedingungen zu ändern“ (Abschnitt 13), und wenn es Ihnen nicht gefällt … nun, dann gehen Sie einfach (Abschnitt 6) … sie sind eine wahre Freude, mit ihnen zu arbeiten!
Wir sind keine Amazon-Affiliates, und auch keine unserer Mitglieder, die Links zu Amazon-Produkten in unserem Discourse veröffentlichen.
Unsere Mitglieder veröffentlichen manchmal Links zu Produkten auf Amazon, die für unsere Community von Interesse sein könnten, aber das wird nicht sehr häufig vorkommen. Ich würde sagen, im Durchschnitt ist es so wenig wie ein Amazon-Link pro Tag. Wir missbrauchen das System also nicht wirklich.
Ich bin immer noch nicht ganz sicher, warum ich die URL direkt vom Server mit wget abrufen kann, ohne dass ein Problem auftritt
Gibt es noch etwas anderes, das ich versuchen oder testen könnte? Gibt es Caches, die ich leeren oder Prozesse, die ich neu starten könnte, um etwas zu ‘aktualisieren’?
Da ich die Seite vom Server selbst mit wget problemlos abrufen kann, ist es keine vollständige IP-Sperre wie bei Vimeo. Wissen wir also, wie sie diese Prüfung durchführen?
Irgendwie wurdest du als unerwünscht identifiziert. Es ist sehr üblich, dass VP-Server vom Scraping blockiert werden. Du benötigst einen Proxy-Crawling-Dienst.
Danke für den Vorschlag. Ein kurzer Blick deutet darauf hin, dass ich ein kostenpflichtiges Abonnement abschließen muss, damit das funktioniert. Gibt es andere Workarounds, die ich nutzen könnte?
Mich interessiert, wie Amazon erkennt, dass Discourse die Anfrage stellt, und diese in Echtzeit blockiert, während die wget-Methode auf demselben Server weiterhin einwandfrei funktioniert.