Self-Hosting Embeddings for DiscourseAI

为了节省空间,可以使用量化嵌入吗?我想使用二进制量化嵌入来真正减小存储大小。经过一些测试,我获得了超过 90% 的性能,存储空间减少了 32 倍!

1 个赞