Suche nach einem Begriff auf Japanisch

yashi · 2. Februar 2022 um 10:58

Ich habe tiny_segmenter von Rubygems ausprobiert und es generiert zumindest die Wörter, die ich im vorherigen Kommentar aufgelistet habe.

# coding: utf-8
require 'tiny_segmenter'
require 'pp'

s = File.read('topic27.txt')

ts = TinySegmenter.new
sg = ts.segment(s, ignore_punctuation: true)
pp(sg)

bundle exec ruby test.rb | grep -e 北側 -e 真上 -e 一般
 "北側",
 "真上",
 "一般",
 "一般",
 "一般",
 "北側",
 "一般",

Eine schnelle Suche nach TinySegmenter hat mir gesagt, dass das verwendete Modell nicht so gut ist. Es gibt einen Modellgenerator dafür.

Ich habe es aber noch nicht ausprobiert.

Thema		Antworten	Aufrufe
Korean words can't be searched Support	36	1691	22. November 2020
Chinese search doesn't work to some words Support	15	1739	31. Oktober 2021
Thai language support for searching Bug	4	1217	11. August 2020
What's the word tokenizer for different languages in discourse? Support	1	625	27. Mai 2020
Optimizing Discourse search for CJK languages Site Management how-to , localization	0	3255	13. Mai 2015

Suche nach einem Begriff auf Japanisch

Verwandte Themen