Impossibile cercare per tag thailandese

versione di Discourse 2.6.0.beta1

Questi sono post di esempio che contengono un tag in thailandese.

Quando vado alla pagina di ricerca e provo a cercare con un carattere thailandese (senza vocale aggiuntiva), i risultati corrispondono alla quantità filtrata dal tag.


Tuttavia, quando cerco con una vocale aggiuntiva, non vengono trovati risultati. (ma nel filtro tag ci sono 17 post)


4 Mi Piace

Ciao K. @siriwatknp e Sawatdee dalla Thailandia,

Immagino che il motore di ricerca dell’app abbia problemi con quasi tutte le vocali thailandesi, (4) segni tonali e (5) diacritici?

Riferimento:

1 Mi Piace

Hai qualche suggerimento su un workaround per questo problema?

Il mio primo suggerimento è cercare online problemi documentati simili e provare a trovare “il modo” in cui altri motori di ricerca gestiscono questo livello di complessità; quindi esaminare il codice di Discourse e vedere quali modifiche potrebbero essere necessarie per migliorare questo algoritmo di ricerca.

A proposito: hai provato altri set di caratteri thai nelle impostazioni della tastiera del tuo browser?

Nota:

Da una ricerca rapida, vedo che alcuni esperti hanno proposto l’approccio “Two-Pass Search Algorithm” (algoritmo di ricerca a due passaggi):

https://www.cicling.org/2008/RCS-vol-33/07-Kruengkrai.pdf

6 Conclusione
Abbiamo presentato un approccio di apprendimento discriminativo per l’analisi morfologica della lingua thai. Consideriamo l’analisi morfologica del thai come un problema di ricerca. Proponiamo l’algoritmo di ricerca a due passaggi che individua il percorso più probabile nello spazio di ricerca espanso. L’obiettivo del nostro algoritmo è aumentare la copertura delle ipotesi di parole basandosi sulla stima della probabilità nel reticolo. I risultati sperimentali sul corpus ORCHID mostrano che l’algoritmo di ricerca a due passaggi può migliorare le prestazioni rispetto all’approccio di ricerca standard.

Vedi anche: Computers and the Thai Language

https://lexitron.nectec.or.th/KM_HL5001/file_HL5001/Paper/Inter%20Journal/krrn_52085.pdf

Questo articolo illustra la storia dello sviluppo della lingua thai per i computer, esaminando fattori quali la lingua, la scrittura e il sistema di scrittura, tra gli altri. L’articolo analizza anche le caratteristiche dei caratteri thai e i metodi di input/output, e affronta le questioni chiave coinvolte nell’elaborazione del testo thai. Infine, l’articolo riporta sulla ricerca nell’elaborazione linguistica e fornisce informazioni dettagliate sulle risorse linguistiche thai.

2 Mi Piace

@siriwatknp Puoi fornirmi il testo e il termine di ricerca in modo che possa provare a riprodurre il problema in locale?

7 Mi Piace

@siriwatknp Ho appena visto che hai inviato una PR per risolvere questo problema :slight_smile: La PR mi sembra corretta ed è stata unita.

5 Mi Piace