改进 CJK帖子的 word_count 计算,或使用 char count

嗯,如果我们能聪明地处理我们的管道,我们可以使用 cppjieba。

这将需要 update_index! 来处理这个:


考虑到阅读单词 bla 比阅读 supercalifragilisticexpialidocious 快得多,字符计数可能是最简单的方法。

我想知道你是否可以做一个 PR 来改变我们依赖字符计数,然后我们可以将字符计数除以 4(例如,对于英语)和 2(对于中文)?(通过一些设置)

@lindsey 这是你感兴趣的一个话题。

1 个赞