Hmm, wenn wir bei unserer Pipeline clever sind, könnten wir cppjieba verwenden.
Dies würde erfordern, dass update_index! sich darum kümmert:
Die Zeichenanzahl ist jedoch wahrscheinlich das Einfachste, da das Lesen des Wortes bla weitaus schneller ist als das Lesen von supercalifragilisticexpialidocious.
Ich frage mich, ob Sie einen PR erstellen könnten, der so geändert wird, dass wir uns auf die Zeichenanzahl verlassen. Dann können wir die Zeichenanzahl durch 4 für Englisch und 2 für Chinesisch teilen? (über eine Einstellung)
@lindsey, das ist ein interessantes Thema für Sie.