Обучение модели на постах сайта?

Возможно, это выходит за рамки задачи, но было бы интересно обучить модель на всех сообщениях моего форума и использовать её для создания экспертного ИИ-бота, с которым пользователи могли бы взаимодействовать, или который мог бы самостоятельно отвечать на вопросы пользователей в темах, ссылаясь на релевантные посты из прошлого или цитируя их.

3 лайка

Я вас понимаю, но здесь есть огромные проблемы с масштабируемостью. Обучение невероятно дорого обходится и даже недоступно для GPT 3.5 / 4.

Отрасль активно продвигает:

  1. Увеличение количества токенов (например, Anthropic с контекстом в 100 тысяч токенов)
  2. Векторные базы данных для эмбеддингов и использование эмбеддингов для контекста
6 лайков

Чат-бот уже делает это без необходимости обучения. Он даже используется в коммерческих целях.

(О, не знаю, почему это подняли вверх.)

2 лайка