Self-Hosting Embeddings for DiscourseAI

几周前,我们开始默认使用半精度(存储空间减半)来存储嵌入,并对索引使用二进制量化(小32倍),因此只需将您的站点更新到最新版本,即可大幅减少磁盘使用量。

3 个赞