Comprimentos mínimos de títulos em sites internacionais

Lá estava eu em 臺鐵用Openstreetmap! - 台灣/Tâi-oân/Tâi-uân/Thòi-vân (Taiwan) - OpenStreetMap Community Forum
tentando postar o assunto
臺鐵用OSM!
Bem, recebi um aviso de que isso tem menos de 15 caracteres
Vamos ver,
echo 臺鐵用OSM!|wc -c 14 Então tive que mudar. echo 臺鐵用Openstreetmap!|wc -c
24
De qualquer forma, há um viés cultural nos padrões do Discourse.
Acontece que um caractere chinês pode conter muito significado e não deve ser apenas
assumido como três pequenos bytes chatos. Kanji japoneses também.

Note que eu não administro nenhum desses sites. Sou apenas o mais humilde dos usuários.

Bem, isso pode ser definido pelos administradores do site. Acho que a culpa deve ser deles.
Eu também sou um usuário chinês, o administrador do meu fórum definiu o comprimento mínimo do assunto para 1.


Atualização: Ah, parece que este é um site para o mundo todo.
De qualquer forma, já que os administradores do site querem ser globais, respeitar as diferenças de idioma é o caminho a seguir.

Estou dizendo que o padrão mundial,

não precisa ser apenas eurocêntrico.
O Discourse permite UTF-8, então também deveria ter um algoritmo melhor para definir o padrão.
Que tal isso, todos os administradores ocidentais precisariam definir um padrão mais alto,
porque o Discourse assumiu que os usuários usavam chinês. Tão injusto quanto a situação oposta atual,
onde todos os administradores orientais precisam mudar o padrão.

1 curtida

O Discourse é enviado com padrões automáticos ajustados para sites se a localidade for definida como chinês

Temos padrões por localidade, nosso padrão chinês não é flexível o suficiente?

11 curtidas

Não sei nada, e fui acionado pela única palavra “blaim” e é por isso que estou novamente divagando para uma meta-discussão :wink:

Sou da Finlândia. Não sei nada sobre chinês ou qualquer outra língua não alfabética. Por causa disso, eu nem pensaria em tal situação.

É por isso que temos (ou precisamos) duas coisas:

  • padrões por idioma ou grupo de idiomas (pelo que sei, existe)
  • um sistema de PM para dizer ao administrador que há um pequeno problema, como um limite de caracteres ridiculamente apertado (e que certamente temos :wink: )

Então, basicamente, aqui estão duas partes diferentes, mas sobrepostas:

  • quais são as opções por design (no tópico aqui)
  • como um administrador usa as opções (fora do tópico aqui)
2 curtidas

o que você poderia fazer é adicionar algo como isto à sua postagem

臺鐵用OSM! <!-- algum texto adicional devido aos limites -->

Se um usuário precisa fazer tais truques, é um forte sinal de design ruim ou de um administrador ruim :wink:

Claro — é uma solução improvisada.

1 curtida

O Discourse vem com padrões automáticos ajustados para sites se a localidade for definida como chinês

Grande erro!

Nos tempos antigos, cada comunidade ficava em seu país de origem.
Tudo estava bem.

Nos tempos mais recentes, agora temos muitas comunidades internacionais,
como o site de exemplo que postei.

Bem, você pode dizer que a comunidade internacional mencionada deveria
definir um padrão diferente.

Tudo bem, mas o problema ainda existe: muito solto para pôsteres ASCII então.
Sim, estamos falando de dois tipos de pôsteres ali no mesmo
site. E esses pôsteres irritantes podem até alternar entre idiomas em um
post para o próximo, ou mesmo no mesmo post, ou mesmo no mesmo Título.

Portanto, proponho que você considere cada caractere chinês valendo 5
caracteres ASCII etc. Não apenas os três atuais, que, nossa, acontece
de ser quantos bytes um caractere UTF-8 tem… E bem, aqueles emojis pontuariam de 2 a 4… que bagunça.

De qualquer forma, aposto que alguém escreveu uma biblioteca que lhe dará o ‘valor’ real de cada caractere, seja ASCII ou não.

Isso não foi nem remotamente verdade. Todas essas plataformas foram feitas para e por americanos. E havia constantemente problemas de caracteres. Todo europeu pode provar que isso é verdade porque o inglês é uma língua minoritária se olharmos para o quadro geral :wink:

2 curtidas

Talvez uma configuração (opcional) por categoria para diminuir o comprimento mínimo possa ajudar. Pois em um fórum internacional, normalmente precisa haver uma categoria dedicada se você postar em chinês (ou qualquer outro idioma).

1 curtida

Este é um Feature request interessante, é um complexo devido à coerência

Além disso, sites não internacionais podem não gostar disso devido a vetores de spam

Não há mudança fácil aqui e muitos controles já existem

2 curtidas

Na verdade, você poderia contar a pontuação como, por exemplo, -1,
unicode , U+002C VÍRGULA ... Categoria: Po (Pontuação, Outro) unicode ’ ’
U+0020 ESPAÇO …
Categoria: Zs (Separador, Espaço);

E aqui obtemos +5, da primeira tradução, c o r a ç ã o
$ unicode -v 心|grep Def
kDefinição: coração; mente, inteligência; alma

Veja, por exemplo,
apropos perluniprops perluniprops (1) - Índice de propriedades de caracteres da versão 14.0.0 do Unicode no Perl apt-cache policy unicode #Debian
unicode:
Instalado: 2.9-1

Bem, é por isso que essas configurações são ajustáveis. Imagino que nos sites em questão, o idioma principal do site não seja o chinês.

Esta configuração mínima foi projetada para ajudar a evitar títulos de tópicos muito vagos. Embora seja muito verdade que o chinês e outras línguas que usam pictogramas realmente tenham uma declaração muito mais completa em um único pictograma do que outras línguas como o inglês e aquelas que usam um sistema de 26 letras.

Portanto, naturalmente, os padrões instalados pelo sistema geralmente seguirão padrões como 15 caracteres no Título e um mínimo de 20 caracteres para os requisitos de postagem.

Não acho que a culpa deva ser de ninguém. Como os sites serão adaptados principalmente para seus públicos. Ou seja, sendo inglês, seria má fé da minha parte esperar que todos os sites estrangeiros para mim tivessem conteúdo em inglês devidamente traduzido.

1 curtida

Esse é o consenso, mas não tenho certeza se realmente funciona. Olá a todos vocês tem 15 caracteres e é muito vago. O mesmo vale para os tópicos — quantas vezes vimos aqui uma resposta curta que termina (mais alguns caracteres). Esse limite de 20 não funciona então e pode apenas adicionar mais ruído. Na verdade, em fóruns de língua inglesa, o limite em tópicos poderia ser apenas 6 e isso para concordo (estamos contando os espaços também?) Em títulos, 3 é suficiente.

Claro, entendo por que precisamos de alguns limites, mas não tenho certeza se 15, 20 ou qualquer coisa dividida por 5 é realmente preciso :wink: Mas ei, é por isso que temos configurações para isso.

Fóruns globais devem fazer alguns ajustes e usar moderadores se títulos muito curtos começarem a ser um problema.

Desculpem, pessoal, se estou magoando os sentimentos de alguém agora, mas este tópico mostra mais que temos muito tempo extra sobrando do que haveria um problema real :rofl:

(Por que o Meta não está me oferecendo mais a lista de emojis?)

2 curtidas

Achamos que estamos forçando os usuários a evitar títulos muito curtos.

Mas, na verdade, estamos forçando outros usuários a usar títulos muito longos.

É tudo um viés cultural.

E não, por favor, não diga “eles deveriam contatar o administrador para ajustar isso”.

A raiz do viés cultural está bem aqui em Discourse.com.

Falta de sensibilidade.

Também é fácil de consertar. Conte os caracteres de forma diferente.

Mas quem se importa. Não é um grande problema nos “mercados que cobrimos”.

Vale a pena notar isto novamente, do trecho acima:

Como você pode imaginar, recebemos muitas solicitações de recursos e de experiência do usuário, e geralmente trabalhamos com o princípio de que as que têm mais interesse são priorizadas mais cedo. Até agora, esta não ganhou muito impulso de ninguém além de você.

Aprecio que possa ser algo que você adoraria ver implementado, embora eu pense que devemos ter o cuidado de manter a discussão civilizada e produtiva, em vez de recorrer a lançar suspeitas.

2 curtidas

O problema com isso, no entanto, é que se você definir arbitrariamente cada caractere chinês como igual a 5 caracteres latinos, e o erro ainda disser “O título deve ter pelo menos 15 caracteres”, e você digitar 3 caracteres chineses e o erro desaparecer, de repente a descrição do erro não fará sentido (porque você digitou 3 caracteres e não 15 caracteres)

Eu acho que em um site internacional, se eu me perguntar “como deus faria” (The God Login) — o site detectaria qual idioma você está tentando digitar o título e mostraria um requisito mínimo de caracteres apropriado de acordo.

  • O título deve ter pelo menos 15 caracteres (para caracteres latinos)
  • O título deve ter pelo menos 7 caracteres (para caracteres japoneses, já que a maioria deles equivale a 2 caracteres latinos, exceto as vogais…)

etc. para cada conjunto de idiomas

Outra questão com isso, no entanto, é que as pessoas também podem usar vários idiomas em um título, como você fez na postagem original.

Trata-se de ponderar o trabalho para tudo isso e o quão útil será em comparação com os padrões globais atuais.

Só estou dizendo que não tenho certeza se há necessidade de se tornar pessoal – eu falo inglês e vietnamita em nível nativo, atualmente aprendendo russo e aprendi um pouco de latim, chinês e japonês. O Discourse tem uma das equipes geograficamente mais diversas que já vi em qualquer lugar (abrangendo 6 continentes e 15 fusos horários). Não acho que esteja relacionado à sensibilidade, mas à logística.

A maioria dos sites usa apenas um idioma e é por isso que há um único padrão global para o comprimento mínimo do título para os administradores alterarem, com padrões por localidade.

Para um site que tem discussões em vários idiomas, o que é muito mais raro, os administradores desse site poderiam reduzir o limite para 3 ou 5 caracteres.

(O motivo pelo qual está nas mãos dos administradores é que, com um mínimo de 3 caracteres, por exemplo, as pessoas poderiam digitar títulos muito curtos e spam em inglês, se esse for o idioma mais comum. Com uma base de usuários madura, pode não ser um problema, mas com outras comunidades, pode ser. Cabe aos administradores ponderar isso com base em sua base de usuários.)

4 curtidas

Eu pensei em outra solução, que é fazer com que o comprimento mínimo do título do tópico possa ser definido por categoria, se houver várias categorias com idiomas diferentes.

Para o núcleo, provavelmente ainda dependeria de quão frequentemente seria usado - mas também poderia ser feito em um plugin.

O motivo do spam / clareza dos títulos é principalmente por que está nas mãos dos administradores em vez dos usuários. Embora eu também entenda o quão frustrante seria para um usuário em um fórum multilíngue no momento.

1 curtida

Seria melhor do que contar bytes, por exemplo:

wcswidth (3) - determinar colunas necessárias para uma string de caractere largo de tamanho fixo

De qualquer forma, é como “Escolha seu avatar” e eles são raça e gênero de outra pessoa.

E sabe de uma coisa, pensei que já tinha postado uma resposta a isso, por e-mail. Mas acho que o tópico foi reatribuído enquanto eu estava offline. Então, quando o e-mail chegou ao Discourse, não havia lugar para postá-lo, então ele foi para o bitbucket. Então descobri um bug. Pelo menos o usuário deveria receber uma mensagem de rejeição.

Search results for 'wcswidth' - Discourse Meta só encontra esta resposta. Meus outros posts por e-mail chegaram bem, mas não aquele em que mencionei wcswidth. Isso deve ser devido à mudança de tópico, etc.

Estou bem com a mudança de tópico. Mas o sistema deve ter certeza de enviar um e-mail de volta ao usuário dizendo que sua postagem falhou… devido a…

OK, posso confirmar que enviar uma mensagem para um tópico já fechado resulta em um e-mail de rejeição (mas ele descarta o corpo que o usuário digitou!), mas para mudanças de tópico, etc., parece que o e-mail é descartado.