No se puede onebox Amazon.co.uk (pero amazon.com funciona)

Hola a todos,

Ejecutando Discourse v2.4.0.beta6+119

No podemos generar onebox para enlaces a productos en amazon.co.uk

Por ejemplo (esto funciona aquí, por cierto): Amazon.co.uk

Podemos generar onebox para enlaces en amazon.com (y otros TLD de Amazon) sin problemas.

La consola del navegador muestra un error 404 Not Found:

Probé la prueba de la lista negra de IPs de Vimeo por si Amazon también ha bloqueado muchas direcciones IP de Digital Ocean, pero curiosamente puedo wget el enlace sin problemas directamente desde el servidor:

xx@xx:~# wget https://www.amazon.co.uk/BG-Electrical-NBS22G-Brushed-Switched/dp/B004TRJYE8
--2019-10-23 14:49:47--  https://www.amazon.co.uk/BG-Electrical-NBS22G-Brushed-Switched/dp/B004TRJYE8
Resolviendo www.amazon.co.uk (www.amazon.co.uk)... 99.86.105.85
Conectando a www.amazon.co.uk (www.amazon.co.uk)|99.86.105.85|:443... conectado.
Solicitud HTTP enviada, esperando respuesta... 200 OK
Longitud: no especificada [text/html]
Guardando en: âB004TRJYE8â

B004TRJYE8                                            [   <=>          ] 711.64K   682KB/s    en 1.0s

2019-10-23 14:49:48 (682 KB/s) - âB004TRJYE8â guardado [728716]

¿Alguna sugerencia sobre qué podría probar a continuación? :thinking:

En mi experiencia, Amazon te baneará muy rápido si los presionas mucho. Además, es automático.

Nuestros miembros han estado encontrando esto con frecuencia últimamente, especialmente porque estamos afiliados a Amazon UK y Amazon France.

La capacidad de crear un onebox y mostrar productos sugeridos relevantes para la discusión obviamente nos ayuda, ya que los fondos de nuestro foro aumentan cuando se compra un artículo utilizando el enlace de afiliado.

Pero que el onebox ya no se muestre es una locura y no ayuda a nadie. Desde entonces he encontrado este hilo de @merefield:

Ten cuidado con el oneboxing de Amazon.

Fui expulsado de su programa por esa “transgresión”.

En su lugar, utilizo los enlaces de imágenes oficiales que ellos proporcionan y generan en su barra de herramientas. Puedes configurarlos dentro del formato de tabla en Markdown para que se vean un poco mejor. Por supuesto, requiere un poco más de trabajo, pero todo depende de la frecuencia con la que necesites hacerlo.

Como mencioné en mi tema original, una gran ventaja de esto es que ellos se encargan de servir estas imágenes.

Gracias, Robert. Advertencia recibida y transmitida.

Legalmente va en contra de sus términos, pero estoy de acuerdo con Jeff; la vez que fui “castigado” probablemente fue por un revisor quisquilloso que tuvo un mal día (y probablemente no estaba familiarizado con Discourse).

Por cierto, Amazon UK me ha rechazado dos veces por “ser un foro” (¡esto no se menciona en ninguna parte de sus normas!). En EE. UU. no hay problema. Es increíblemente frustrante cómo parecen aplicar reglas diferentes según la región.

Al igual que con el soporte para vendedores de Amazon, todo depende de quién reciba tu consulta o, en este caso, tu solicitud, para determinar qué respuesta obtendrás.

El Acuerdo de Operación del Programa de Afiliados de Amazon se actualizó recientemente el 6 de septiembre de 2019 (Reino Unido) y el 1 de octubre en .com.

Como siempre, incluyen la cláusula de “nos reservamos el derecho de modificar cualquier parte de los términos y condiciones del acuerdo” (sección 13), y si no te gusta… bueno, lárgate (sección 6). ¡Son un placer con el que trabajar!

https://affiliate-program.amazon.co.uk/help/operating/agreement

No somos afiliados de Amazon, ni lo son ninguno de nuestros miembros que publican enlaces a productos de Amazon en nuestro Discourse.

Nuestros miembros a veces publican enlaces a productos en Amazon que pueden ser de interés para nuestra comunidad, pero no serán muchos; diría que el promedio es tan bajo como un enlace a Amazon por día. Por lo tanto, no estamos abusando realmente del sistema.

Aún no estoy muy seguro de por qué puedo usar wget para obtener la URL directamente desde el servidor sin problemas, aunque :thinking:

¿Hay algo más que pueda intentar o probar? ¿Algún caché que pueda limpiar o algún proceso que pueda reiniciar para “actualizar” algo?

La trama se complica / la confusión continúa…

¿Alguna idea de qué está pasando aquí? :thinking:

La primera URL genera una tarjeta, aunque con un mensaje de Verificación de robot, ¿eso revela algo a alguien?

La segunda URL no genera ninguna tarjeta en absoluto.

URL en cuestión: https://www.amazon.co.uk/dp/B0791RGQW3/

:man_shrugging:

Por cierto, el mensaje Robot Check no aparece aquí en meta, solo una onebox en blanco:

Robot Check significa que estás siendo bloqueado como un bot.

No está bien :confused:

Como puedo wget la página desde el propio servidor sin problemas, no es un bloqueo directo por IP como el que usa Vimeo, así que ¿sabemos cómo están realizando esta verificación?

¿Alguna sugerencia para una solución alternativa? :thinking:

De alguna manera, has sido identificado como no deseado. Es muy común que los servidores de VP sean bloqueados para el rastreo. Necesitas un servicio de rastreo con proxy.

Yo apoyo uno en mi plugin: onebox assistant

Gracias por la sugerencia. Un vistazo rápido indica que necesito suscribirme a un servicio de pago para que funcione. ¿Hay alguna otra solución alternativa que pueda usar?

Me pregunto cómo Amazon sabe que Discourse está realizando la solicitud y la bloquea al instante, cuando la ruta wget en el mismo servidor sigue funcionando correctamente.

Probablemente sea la cadena del User Agent.

¿Qué presenta Discourse como su User-Agent?

¿Podría falsificar esto para que parezca un navegador Firefox regular o algo así? :thinking: