Oneboxing de Wikipedia de artículos que contienen caracteres inusuales en la URL

If you link to Wikipedia by reference, then the link works.

Филиппов, Михаил Михайлович (учёный)

If I copy the address from the browser line:

Original address

https://ru.wikipedia.org/wiki/%D0%A4%D0%B8%D0%BB%D0%B8%D0%BF%D0%BF%D0%BE%D0%B2,_%D0%9C%D0%B8%D1%85%D0%B0%D0%B8%D0%BB_%D0%9C%D0%B8%D1%85%D0%B0%D0%B9%D0%BB%D0%BE%D0%B2%D0%B8%D1%87_(%D1%83%D1%87%D1%91%D0%BD%D1%8B%D0%B9)

Perhaps the error is not common, but in the last 2 days, users noticed that some Wikipedia articles (Russian) are processed in a similar way.

Perhaps because there is a comma in the link?

2 Me gusta

Same issue with ASCII-only titles containing commas:

I - Wikipedia,Robot(film)

https://en.wikipedia.org/wiki/I,_Robot_(film)

3 Me gusta

El autovinculador evita ciertos casos extremos por diseño; la última vez que mencioné esto a @Vitaly, la recomendación general fue usar <....... aquí para casos extremos terribles, lo que te permite sortear este problema. Sin embargo, no funciona con un solo cuadro.

La solución temporal actual consiste en reemplazar , por %2c.

https://ru.wikipedia.org/wiki/%D0%A4%D0%B8%D0%BB%D0%B8%D0%BF%D0%BF%D0%BE%D0%B2%2C_%D0%9C%D0%B8%D1%85%D0%B0%D0%B8%D0%BB_%D0%9C%D0%B8%D1%85%D0%B0%D0%B9%D0%BB%D0%BE%D0%B2%D0%B8%D1%87_(%D1%83%D1%87%D1%91%D0%BD%D1%8B%D0%B9)

2 Me gusta

También es raro cuando la URL de Wikipedia termina con un signo de exclamación.

https://en.wikipedia.org/wiki/Top_Secret!

Tienes que codificarla en URL también.

https://en.wikipedia.org/wiki/Top_Secret%21

1 me gusta
  • Dado que linkify-it utiliza heurísticas, nunca puede garantizar una confianza del 100 % (incluso el 99,99 % != 100 %) => requiere algún marcador (actualmente \u003c..\u003e) para forzar los bordes de los enlaces.
  • Tu onebox también requiere algún marcador para forzar el encendido/apagado.

Por lo tanto: tienes dos modos de procesamiento independientes => necesitas 2 marcadores/banderas independientes para definir.

Actualmente, solo tienes un único marcador para 2 modos. Esa es una colisión lógica. En mi proyecto resolví el problema de esta manera:

  1. Permití aplicar el convertidor de enlaces a los autolinks (\u003c...\u003e - este marcado).
  2. Añadí una casilla de verificación en las opciones del editor “desactivar expansión de enlaces” (para cada publicación).

No es ideal, pero está bien para mí. Quizás puedas inventar una mejor manera de añadir un segundo marcado/bandera para tu caso.

3 Me gusta