Quando vado alla pagina di ricerca e provo a cercare con un carattere thailandese (senza vocale aggiuntiva), i risultati corrispondono alla quantità filtrata dal tag.
Il mio primo suggerimento è cercare online problemi documentati simili e provare a trovare “il modo” in cui altri motori di ricerca gestiscono questo livello di complessità; quindi esaminare il codice di Discourse e vedere quali modifiche potrebbero essere necessarie per migliorare questo algoritmo di ricerca.
A proposito: hai provato altri set di caratteri thai nelle impostazioni della tastiera del tuo browser?
Nota:
Da una ricerca rapida, vedo che alcuni esperti hanno proposto l’approccio “Two-Pass Search Algorithm” (algoritmo di ricerca a due passaggi):
6 Conclusione
Abbiamo presentato un approccio di apprendimento discriminativo per l’analisi morfologica della lingua thai. Consideriamo l’analisi morfologica del thai come un problema di ricerca. Proponiamo l’algoritmo di ricerca a due passaggi che individua il percorso più probabile nello spazio di ricerca espanso. L’obiettivo del nostro algoritmo è aumentare la copertura delle ipotesi di parole basandosi sulla stima della probabilità nel reticolo. I risultati sperimentali sul corpus ORCHID mostrano che l’algoritmo di ricerca a due passaggi può migliorare le prestazioni rispetto all’approccio di ricerca standard.
Questo articolo illustra la storia dello sviluppo della lingua thai per i computer, esaminando fattori quali la lingua, la scrittura e il sistema di scrittura, tra gli altri. L’articolo analizza anche le caratteristiche dei caratteri thai e i metodi di input/output, e affronta le questioni chiave coinvolte nell’elaborazione del testo thai. Infine, l’articolo riporta sulla ricerca nell’elaborazione linguistica e fornisce informazioni dettagliate sulle risorse linguistiche thai.