Falco
(Falco)
32
Да.
Да, каждая модель генерирует разные векторные представления.
По сути, это один вызов на тему, поэтому рассчитать очень просто.
Если большинство ваших тем длинные, они будут обрезаны до 8 тыс. токенов, в противном случае будет использоваться длина вашей темы.
Да.
Оба процесса работают на уровне тем, то есть по одному вызову на тему.
2 лайка