Wikipedia oneboxing of articles containing unusual characters in the URL

If you link to Wikipedia by reference, then the link works.

Филиппов, Михаил Михайлович (учёный)

If I copy the address from the browser line:

Филиппов — Википедия,%D0%9C%D0%B8%D1%85%D0%B0%D0%B8%D0%BB%D0%9C%D0%B8%D1%85%D0%B0%D0%B9%D0%BB%D0%BE%D0%B2%D0%B8%D1%87_(%D1%83%D1%87%D1%91%D0%BD%D1%8B%D0%B9)

Original address

https://ru.wikipedia.org/wiki/%D0%A4%D0%B8%D0%BB%D0%B8%D0%BF%D0%BF%D0%BE%D0%B2,_%D0%9C%D0%B8%D1%85%D0%B0%D0%B8%D0%BB_%D0%9C%D0%B8%D1%85%D0%B0%D0%B9%D0%BB%D0%BE%D0%B2%D0%B8%D1%87_(%D1%83%D1%87%D1%91%D0%BD%D1%8B%D0%B9)

Perhaps the error is not common, but in the last 2 days, users noticed that some Wikipedia articles (Russians) are processed in a similar way.

Perhaps because there is a comma in the link?

2 curtidas

Same issue with ASCII-only titles containing commas:

I - Wikipedia,Robot(film)

https://en.wikipedia.org/wiki/I,_Robot_(film)

3 curtidas

The autolinker avoids certain extreme edge cases by design, last time I mentioned this to @Vitaly the general recommendation is to use <.......> here for terrible edge cases which allows you to workaround this. Does not work with one box though.

Current workaround is to swap , with %2c

https://ru.wikipedia.org/wiki/%D0%A4%D0%B8%D0%BB%D0%B8%D0%BF%D0%BF%D0%BE%D0%B2%2c_%D0%9C%D0%B8%D1%85%D0%B0%D0%B8%D0%BB_%D0%9C%D0%B8%D1%85%D0%B0%D0%B9%D0%BB%D0%BE%D0%B2%D0%B8%D1%87_(%D1%83%D1%87%D1%91%D0%BD%D1%8B%D0%B9)

2 curtidas

Also weird when the Wikipedia URL ends in an exclamation point.

https://en.wikipedia.org/wiki/Top_Secret!

You have to URL encode that as well…

https://en.wikipedia.org/wiki/Top_Secret%21

1 curtida
  • Como linkify-it usa heurística, ele nunca pode garantir 100% de confiança (mesmo 99,99% != 100%) =\u003e ele requer algum marcador (atualmente \u003c..\u003e) para forçar as bordas do link.
  • Seu onebox também requer algum marcador para forçar ligar/desligar.

Então: você tem dois modos de processamento independentes =\u003e precisa de 2 marcadores/flags independentes para definir.

Atualmente, você tem apenas um único marcador para 2 modos. Essa é uma colisão lógica. No meu projeto, resolvi o problema desta forma:

  1. Permiti aplicar o conversor de links a autolinks (\u003c...\u003e - esta marcação).
  2. Adicionei uma caixa de seleção às opções do editor “desativar expansão de links” (para cada postagem)

Não é o ideal, mas está bom para mim. Talvez você possa inventar uma maneira melhor de adicionar a segunda marcação/flag para o seu caso.

3 curtidas