CJK投稿の単語数カウントを改善するか、文字数を使用する

もしパイプラインについて賢く考えれば、cppjieba を使うことができます。

これには、update_index! がこれを処理する必要があります。


文字数の方がおそらく最も簡単な方法でしょう。単語「bla」を読むのは、「supercalifragilisticexpialidocious」を読むよりもはるかに速いためです。

文字数に依存するように変更するプルリクエストを作成できるかどうか疑問に思っています。たとえば、英語の場合は文字数を 4 で割り、中国語の場合は 2 で割ることができますか?(何らかの設定を介して)

@lindsey これはあなたにとって興味深いトピックです。

「いいね!」 1