Falco
(Falco)
32
Sí.
Sí, cada modelo produce representaciones vectoriales diferentes.
Básicamente, es una llamada por tema, por lo que es muy fácil de calcular.
Si la mayoría de tus temas son largos, se truncarán a 8k tokens, de lo contrario, usarán la longitud de tu tema.
Sí.
Ambos funcionan a nivel de tema, por lo que uno por tema.
2 Me gusta