Longueurs minimales des titres sur les sites internationaux

J’étais sur 臺鐵用Openstreetmap! - 台灣/Tâi-oân/Tâi-uân/Thòi-vân (Taiwan) - OpenStreetMap Community Forum
en essayant de poster un sujet
臺鐵用OSM!
Eh bien, j’ai reçu un avertissement indiquant que c’était moins de 15 caractères.
Voyons voir,
echo 臺鐵用OSM!|wc -c 14 J'ai donc dû le changer. echo 臺鐵用Openstreetmap!|wc -c
24
Quoi qu’il en soit, il y a un biais culturel dans les paramètres par défaut de Discourse.
Il se trouve qu’un caractère chinois peut contenir beaucoup de sens, et ne devrait pas être simplement
supposé être trois petits octets ennuyeux. Les kanji japonais aussi.

Notez que je n’administre aucun de ces sites. Je ne suis que le plus humble des utilisateurs.

Eh bien, cela peut être défini par les administrateurs du site. Je pense que cela devrait leur être reproché.
Je suis également un utilisateur chinois, l’administrateur de mon forum a défini la longueur minimale du sujet à 1.


MàJ : Oh, il semble que ce soit un site pour le monde entier.
Dans tous les cas, puisque les administrateurs du site veulent être mondiaux, le respect des différences linguistiques est la voie à suivre.

Je dis que la valeur par défaut mondiale,

n’a pas besoin d’être uniquement centrée sur l’Europe.
Discourse autorise l’UTF-8, il devrait donc également avoir un meilleur algorithme pour définir la valeur par défaut.
Que diriez-vous de ceci, tous les administrateurs occidentaux devraient définir une valeur par défaut plus élevée,
parce que Discourse suppose que les utilisateurs utilisent le chinois. Tout aussi injuste que la situation inverse actuelle,
où tous les administrateurs orientaux doivent changer la valeur par défaut.

1 « J'aime »

Discourse est livré avec des valeurs par défaut automatiques ajustées pour les sites si la locale est définie sur le chinois

Nous avons des valeurs par défaut par locale, nos valeurs par défaut chinoises ne sont-elles pas assez souples ?

11 « J'aime »

Je ne sais rien, et j’ai été déclenché par le simple mot « blaim » et c’est pourquoi je dérive à nouveau vers une méta-discussion :wink:

Je viens de Finlande. Je ne sais rien des langues chinoises ou de toute autre langue non alphabétique. Pour cette raison, je ne penserais même pas à une telle situation.

C’est pourquoi nous avons (ou avons besoin de) deux choses :

  • des valeurs par défaut par langue ou groupe de langues (à ma connaissance, il y en a)
  • un système de MP pour signaler à l’administrateur qu’il y a un problème mineur, une limite de caractères ridiculement serrée (et nous en avons à coup sûr :wink: )

Donc, fondamentalement, voici deux parties différentes, mais qui se chevauchent :

  • quelles sont les options par conception (sujet ici)
  • comment un administrateur utilise les options (hors sujet ici)
2 « J'aime »

ce que vous pourriez faire est d’ajouter quelque chose comme ceci à votre publication

臺鐵用OSM! <!-- some more text because limits -->

Si un utilisateur doit faire de telles astuces, c’est un signe fort de mauvaise conception ou de mauvais administrateur :wink:

Bien sûr, c’est une solution de fortune.

1 « J'aime »

Discourse est livré avec des valeurs par défaut automatiques ajustées pour les sites si la locale est définie sur le chinois

Grosse erreur !

Dans les temps anciens, chaque communauté restait dans son pays d’origine.
Tout allait bien.

Dans les temps plus récents, nous avons maintenant beaucoup de communautés internationales,
comme le site d’exemple que j’ai posté.

Eh bien, vous pourriez dire que ladite communauté internationale devrait
définir un défaut différent.

D’accord, mais le problème est toujours là : trop lâche pour les affiches ASCII alors.
Oui, nous parlons de deux types d’affiches là sur le même
site. Et ces affiches gênantes pourraient même passer d’une langue à l’autre
d’une publication à l’autre, ou même dans la même publication, ou même dans le même titre.

Par conséquent, je propose que vous considériez chaque caractère chinois comme valant 5
caractères ASCII, etc. Pas seulement les trois actuels, qui, bon sang, correspondent au nombre d’octets d’un caractère UTF-8… Et bien, ces emojis rapporteraient de 2 à 4… quel désordre.

Quoi qu’il en soit, je parie que quelqu’un a écrit une bibliothèque qui vous donnera la vraie
« valeur » de chaque caractère, qu’il soit ASCII ou non.

C’était loin d’être vrai. Toutes ces plateformes ont été créées pour et par des Américains. Et il y avait constamment des problèmes de caractères. Chaque Européen peut prouver que c’est vrai car l’anglais est une langue minoritaire si l’on considère la situation dans son ensemble :wink:

2 « J'aime »

Peut-être qu’un paramètre (facultatif) par catégorie pour abaisser la longueur minimale pourrait aider. Car dans un forum international, il doit normalement y avoir une catégorie dédiée si vous publiez en chinois (ou dans toute autre langue).

1 « J'aime »

Ceci est une #demande de fonctionnalité intéressante, elle est complexe en raison de la cohérence

De plus, les sites non internationaux pourraient ne pas apprécier cela en raison des vecteurs de spam

Il n’y a pas de changement facile ici et de nombreux réglages existent déjà

2 « J'aime »

En fait, vous pourriez compter la ponctuation comme, par exemple, -1,
unicode , U+002C virgule ... Catégorie : Po (Ponctuation, Autre) unicode ’ ’
U+0020 espace …
Catégorie : Zs (Séparateur, Espace) ;

Et ici, nous obtenons +5, de la première traduction, c œ u r
$ unicode -v 心|grep Def
kDéfinition : cœur ; esprit, intelligence ; âme

Voir par exemple,
apropos perluniprops perluniprops (1) - Index des propriétés de caractères de la version 14.0.0 d'Unicode dans Perl apt-cache policy unicode #Debian
unicode :
Installé : 2.9-1

Eh bien, c’est pourquoi ces paramètres sont ajustables. J’imagine que sur les sites en question, la langue principale du site n’est pas le chinois.

Ce paramètre minimum est conçu pour éviter des titres de sujets très vagues. Bien qu’il soit très vrai que le chinois et d’autres langues qui utilisent des pictogrammes ont en effet une déclaration beaucoup plus complète en un seul glyphe que d’autres langues comme l’anglais et celles qui utilisent un système d’alphabet de 26 lettres.

Ainsi, naturellement, les paramètres par défaut installés par le système suivront généralement des normes comme 15 caractères dans le titre et un minimum de 20 caractères pour les exigences de publication.

Je ne pense pas que le blâme doive incomber à qui que ce soit. Les sites seront principalement adaptés à leurs cibles. C’est-à-dire qu’étant anglais, ce serait de mauvaise foi de ma part d’attendre de tous les sites étrangers qu’ils aient un contenu anglais correctement traduit.

1 « J'aime »

C’est le consensus, mais je ne suis pas tout à fait sûr que cela fonctionne vraiment. Bonjour à tous fait 15 caractères et est très vague. Idem pour les sujets — combien de fois avons-nous vu ici une réponse courte qui se termine par (plus quelques caractères de plus). Cette limite de 20 ne fonctionne donc pas et ne peut qu’ajouter du bruit. En fait, sur les forums anglophones, la limite pour les sujets pourrait être de 6 et cela arrête Je suis d’accord (comptons-nous aussi les espaces ?) Pour les titres, 3 suffisent.

Bien sûr, je comprends pourquoi nous avons besoin de certaines limites, mais je ne suis pas tout à fait sûr que 15, 20 ou quoi que ce soit divisé par 5 soit vraiment précis :wink: Mais bon, c’est pour cela que nous avons des paramètres pour cela.

Les forums mondiaux doivent faire des ajustements et utiliser des modérateurs si des titres trop courts commencent à poser problème.

Désolé les gars si je blesse quelqu’un maintenant, mais ce sujet montre que nous avons beaucoup trop de temps libre à dépenser alors qu’il n’y aurait pas de vrai problème :rofl:

(Pourquoi Meta ne me propose-t-il plus la liste des emojis ?)

2 « J'aime »

Nous pensons forcer les utilisateurs à éviter les titres trop courts.

Mais en fait, nous forçons d’autres utilisateurs à utiliser des titres trop longs.

C’est entièrement un biais culturel.

Et non, s’il vous plaît, ne dites pas « ils devraient contacter leur administrateur pour l’ajuster ».

La racine du biais culturel se trouve ici, sur Discourse.com.

Un manque de sensibilité.

Facile à corriger aussi. Comptez les caractères différemment.

Mais qui s’en soucie. Ce n’est pas un gros problème sur les « marchés que nous couvrons ».

Il convient de noter à nouveau ceci, tiré de ce qui précède :

Comme vous pouvez l’imaginer, nous recevons beaucoup de demandes de fonctionnalités et d’expériences utilisateur, et nous travaillons généralement sur le principe que celles qui suscitent le plus d’intérêt sont prioritaires plus tôt. Jusqu’à présent, celle-ci n’a pas suscité beaucoup d’intérêt de la part de qui que ce soit d’autre que vous.

J’apprécie que ce soit quelque chose que vous aimeriez voir implémenté, bien que je pense que nous devrions veiller à maintenir une discussion civile et productive plutôt que de recourir à des insinuations.

2 « J'aime »

Le problème avec cela, cependant, c’est que si vous définissez arbitrairement chaque caractère chinois comme équivalant à 5 caractères latins, et que l’erreur indique toujours « Le titre doit comporter au moins 15 caractères », et que vous tapez 3 caractères chinois, puis que l’erreur disparaît, la description de l’erreur n’aura soudainement aucun sens (car vous avez tapé 3 caractères et non 15 caractères).

Je suppose que sur un site international, si je me demande « comment Dieu ferait-il » — le site détecterait la langue dans laquelle vous essayez de taper le titre et afficherait une exigence de nombre minimum de caractères appropriée en conséquence.

  • Le titre doit comporter au moins 15 caractères (pour les caractères latins)
  • Le titre doit comporter au moins 7 caractères (pour les caractères japonais car la plupart d’entre eux équivalent à 2 caractères latins, à l’exception des voyelles…)

etc. pour chaque ensemble de langues.

Un autre problème avec cela, cependant, est que les gens peuvent également utiliser plusieurs langues dans un titre, comme vous l’avez fait dans le message d’origine.

Il s’agit de peser le travail pour tout cela et son utilité par rapport aux valeurs par défaut globales actuelles.

Je dis juste que je ne suis pas sûr qu’il soit nécessaire de devenir personnel – je parle couramment l’anglais et le vietnamien, j’apprends actuellement le russe et j’ai appris un peu le latin, le chinois et le japonais. Discourse a l’une des équipes géographiquement les plus diverses que j’aie jamais vues (réparties sur 6 continents et 15 fuseaux horaires). Je ne pense pas que ce soit lié à la sensibilité, mais à la logistique.

La plupart des sites n’utilisent qu’une seule langue, c’est pourquoi il existe une seule valeur par défaut globale pour la longueur minimale du titre que les administrateurs peuvent modifier, avec des valeurs par défaut par locale.

Pour un site qui a des discussions dans de nombreuses langues, ce qui est beaucoup plus rare, les administrateurs de ce site pourraient abaisser la limite à 3 ou 5 caractères.

(La raison pour laquelle cela est entre les mains des administrateurs est qu’avec un minimum de 3 caractères, par exemple, les gens pourraient alors taper des titres très courts et spammés en anglais, si c’est la langue la plus courante. Avec une base d’utilisateurs matures, cela pourrait ne pas être un problème, mais avec d’autres communautés, cela pourrait l’être. C’est aux administrateurs de peser cela en fonction de leur base d’utilisateurs.)

4 « J'aime »

J’ai pensé à une autre solution, qui consiste à faire en sorte que la longueur minimale du titre du sujet puisse être définie par catégorie, s’il existe plusieurs catégories avec des langues différentes.

Pour le cœur, cela dépendrait probablement encore de la fréquence d’utilisation – mais cela pourrait également être fait dans un plugin.

La raison du spam / la clarté des titres est la principale raison pour laquelle c’est entre les mains des administrateurs plutôt que des utilisateurs. Bien que je comprenne également à quel point ce serait frustrant pour un utilisateur sur un forum multilingue actuellement.

1 « J'aime »

Mieux que de compter les octets serait par exemple :

wcswidth (3) - déterminer les colonnes nécessaires pour une chaîne de caractères larges de taille fixe

Quoi qu’il en soit, c’est comme « Choisissez votre avatar » et ce sont la race et le genre de quelqu’un d’autre.

Et vous savez quoi, je pensais avoir déjà posté une réponse à cela, par e-mail. Mais je pense que le sujet a été réattribué pendant que j’étais hors ligne. Donc, lorsque l’e-mail est arrivé à Discourse, il n’y avait aucun endroit où le poster, il est donc allé dans le bitbucket. J’ai donc découvert un bug. Au moins, l’utilisateur devrait recevoir un message de rejet.

Search results for 'wcswidth' - Discourse Meta ne trouve que cette réponse. Mes autres publications par e-mail sont arrivées correctement, mais pas celle où j’ai mentionné wcswidth. Cela doit être dû au changement de sujet, etc.

Je suis d’accord avec le changement de sujet. Mais le système doit s’assurer d’envoyer un e-mail à l’utilisateur lui indiquant que son message a échoué… en raison de…

OK, je peux confirmer que l’envoi d’un message à un sujet déjà fermé entraîne un e-mail de rejet (mais il supprime le corps que l’utilisateur a tapé !), mais pour les changements de sujet, etc., il semble que l’e-mail soit supprimé.