Существует ли какой-либо ориентир по стоимости, эталонный показатель или формула приблизительной оценки, которая помогла бы мне понять разовые затраты (массовое встраивание) и постоянные расходы (встраивание и поиск) при включении Discourse AI с использованием облачной LLM?
Для самостоятельно размещённой LLM какая типичная конфигурация сервера и соответствующие затраты потребуются?
Я считаю, что вам понадобится GPU, но использование GPU предпочтительнее, если вы хотите размещать модель локально. Обратите внимание на такие решения, как Ollama.
Для массового создания эмбеддингов требуется один запрос на тему, поэтому большинство сайтов смогут выполнить это, используя, например, бесплатный тариф Gemini.
Поиск требует одного запроса на поиск, что, скорее всего, также уложится в бесплатный тариф.