Autoalojamiento de Embeddings para DiscourseAI

Para ahorrar espacio, ¿es posible usar incrustaciones cuantificadas? Me gustaría usar incrustaciones cuantificadas binarias para reducir realmente el tamaño de almacenamiento. Después de hacer algunas pruebas, ¡obtengo un rendimiento superior al 90% con un almacenamiento 32 veces menor!

1 me gusta