Что касается использования внешних ресурсов: если хотите, вы можете запускать свою LLM локально:
Но пробовали ли вы это делать в рамках какого-либо проекта?
Для этого потребуется владеть или арендовать особенно мощное оборудование!
Попробуйте сами запустить более компактные языковые модели (которые вы могли бы рассмотреть для размещения) и посмотрите, насколько они вас впечатлят:
Результаты могут различаться, но на мой взгляд, вам стоит рассматривать размещение модели как минимум с 70 миллиардами параметров, что будет довольно затратно при самостоятельном хостинге.
Для справки: GPT 3.5, по утверждениям, является моделью с 175 миллиардами параметров, а GPT 4 имеет почти 2 триллиона (как они говорят) ![]()
Я написал этот плагин:
В нём есть функция автоматической разметки с помощью ИИ. По моему опыту, для качественной работы требуется GPT 4 Turbo (и тогда она действительно работает отлично!)
Если вы планируете самостоятельно разместить что-то столь же мощное, вам понадобятся очень глубокие карманы.
Именно поэтому использование внешнего API LLM остаётся привлекательным вариантом с оплатой по факту использования, особенно потому, что вы платите только за сделанные вызовы, а не за дорогостоящую инфраструктуру, которая простаивает без дела.
Конечно, если конфиденциальность является серьёзной и достаточной причиной для беспокойства, это может изменить расчёты.