Wikipedia oneboxing of articles containing unusual characters in the URL

If you link to Wikipedia by reference, then the link works.

Филиппов, Михаил Михайлович (учёный)

If I copy the address from the browser line:

Филиппов — Википедия,%D0%9C%D0%B8%D1%85%D0%B0%D0%B8%D0%BB%D0%9C%D0%B8%D1%85%D0%B0%D0%B9%D0%BB%D0%BE%D0%B2%D0%B8%D1%87_(%D1%83%D1%87%D1%91%D0%BD%D1%8B%D0%B9)

Original address

https://ru.wikipedia.org/wiki/%D0%A4%D0%B8%D0%BB%D0%B8%D0%BF%D0%BF%D0%BE%D0%B2,_%D0%9C%D0%B8%D1%85%D0%B0%D0%B8%D0%BB_%D0%9C%D0%B8%D1%85%D0%B0%D0%B9%D0%BB%D0%BE%D0%B2%D0%B8%D1%87_(%D1%83%D1%87%D1%91%D0%BD%D1%8B%D0%B9)

Perhaps the error is not common, but in the last 2 days, users noticed that some Wikipedia articles (Russians) are processed in a similar way.

Perhaps because there is a comma in the link?

2 Mi Piace

Same issue with ASCII-only titles containing commas:

I - Wikipedia,Robot(film)

https://en.wikipedia.org/wiki/I,_Robot_(film)

3 Mi Piace

The autolinker avoids certain extreme edge cases by design, last time I mentioned this to @Vitaly the general recommendation is to use <.......> here for terrible edge cases which allows you to workaround this. Does not work with one box though.

Current workaround is to swap , with %2c

https://ru.wikipedia.org/wiki/%D0%A4%D0%B8%D0%BB%D0%B8%D0%BF%D0%BF%D0%BE%D0%B2%2c_%D0%9C%D0%B8%D1%85%D0%B0%D0%B8%D0%BB_%D0%9C%D0%B8%D1%85%D0%B0%D0%B9%D0%BB%D0%BE%D0%B2%D0%B8%D1%87_(%D1%83%D1%87%D1%91%D0%BD%D1%8B%D0%B9)

2 Mi Piace

Also weird when the Wikipedia URL ends in an exclamation point.

https://en.wikipedia.org/wiki/Top_Secret!

You have to URL encode that as well…

https://en.wikipedia.org/wiki/Top_Secret%21

1 Mi Piace
  • Poiché linkify-it utilizza euristiche, non può mai garantire una confidenza del 100% (anche 99,99% != 100%) =\u003e richiede un marcatore (attualmente \u003c..\u003e) per forzare i bordi dei link.
  • Anche il tuo onebox richiede un marcatore per forzare l’attivazione/disattivazione.

Quindi: hai due modalità di elaborazione indipendenti =\u003e sono necessari 2 marcatori/flag indipendenti per definirle.

Attualmente, hai un singolo marcatore per 2 modalità. Questa è una collisione logica. Nel mio progetto ho risolto il problema in questo modo:

  1. Ho permesso di applicare il convertitore di link agli autolink (\u003c...\u003e - questo markup).
  2. Ho aggiunto una casella di controllo alle opzioni dell’editor “disabilita espansione link” (per ogni post).

Non è l’ideale, ma per me va bene. Forse puoi inventare un modo migliore per aggiungere un secondo markup/flag per il tuo caso.

3 Mi Piace