Impossible de rechercher par tag thaïlandais

version de Discourse 2.6.0.beta1

Ce sont des exemples de publications qui contiennent un tag en thaï.

Lorsque je vais sur la page de recherche et que j’essaie de rechercher avec un caractère thaï (sans voyelle supplémentaire), les résultats correspondent au nombre de filtres de tag.


Cependant, lorsque je recherche avec une voyelle supplémentaire, aucun résultat n’est trouvé. (mais dans le filtre de tag, il y a 17 publications)


4 « J'aime »

Bonjour K. @siriwatknp et Sawatdee de Thaïlande,

Je suppose que le moteur de recherche de l’application a des problèmes avec presque toutes les voyelles thaïes, les (4) marques de ton et les (5) diacritiques ?

Référence :

1 « J'aime »

Une suggestion pour contourner ce problème ?

Ma première suggestion est de rechercher sur Internet des problèmes similaires documentés et d’essayer de trouver « la méthode » utilisée par d’autres moteurs de recherche pour gérer cette couche de complexité ; puis d’examiner le code de Discourse et de voir quels changements pourraient être nécessaires pour améliorer cet algorithme de recherche.

À propos : Avez-vous essayé d’autres jeux de caractères thaïlandais dans les paramètres de votre clavier de navigateur ?

Note :

Une recherche rapide montre que certains experts ont proposé l’approche de « l’algorithme de recherche en deux passes » :

https://www.cicling.org/2008/RCS-vol-33/07-Kruengkrai.pdf

6 Conclusion
Nous avons présenté une approche d’apprentissage discriminatif pour l’analyse morphologique thaïlandaise. Nous considérons l’analyse morphologique thaïlandaise comme un problème de recherche. Nous proposons un algorithme de recherche en deux passes qui trouve le chemin le plus probable dans l’espace de recherche étendu. L’objectif de notre algorithme est d’augmenter la couverture des hypothèses de mots basées sur l’estimation de probabilité dans le treillis. Les résultats expérimentaux sur le corpus ORCHID montrent que l’algorithme de recherche en deux passes peut améliorer les performances par rapport à l’approche de recherche standard.

Voir également : Ordinateurs et langue thaïlandaise

https://lexitron.nectec.or.th/KM_HL5001/file_HL5001/Paper/Inter%20Journal/krrn_52085.pdf

Cet article explique l’histoire du développement de la langue thaïlandaise pour les ordinateurs, en examinant des facteurs tels que la langue, l’écriture et le système d’écriture, entre autres. L’article analyse également les caractéristiques des caractères thaïlandais et les méthodes d’entrée/sortie, et aborde les questions clés impliquées dans le traitement du texte thaïlandais. Enfin, l’article rend compte de la recherche en traitement linguistique et fournit des informations détaillées sur les ressources de la langue thaïlandaise.

2 « J'aime »

@siriwatknp Peux-tu me fournir le texte et le terme de recherche afin que je puisse essayer de reproduire le problème localement ?

7 « J'aime »

@siriwatknp Je viens de voir que vous avez soumis une PR pour résoudre ce problème :slight_smile: La PR me semble bonne et a été fusionnée.

5 « J'aime »