AI-помощник сильно галлюцинирует при объяснении чего-либо

Я не могу точно определить, когда помощник на базе ИИ начал галлюцинировать (то есть, когда он не знает ответа и начинает проявлять «творчество»), так как у меня уже около трёх недель были другие дела, но сегодня функция объяснения оказалась совершенно бесполезной.

Раньше я часто использовал её для разъяснения терминов и выражений читателям, и для меня это было самой ценной возможностью, которую может предложить помощник на базе ИИ [1]. Конечно, он склонен находить контекст в самом посте, но такой уровень галлюцинаций уже слишком велик.

Это связано с промптингом и/или моделью. Я пользуюсь услугами OpenAI и не думаю, что захочу их менять, так как тогда мне пришлось бы переписать все промпты. Самостоятельно размещённая модель не вариант — я слишком беден для этого.

Так какие у меня есть реалистичные варианты сейчас? Перестать её использовать?

Редактирование

Я использовал 4.0-mini и переключился на 4.1-mini. Ответы стали лучше, но… это общее знание довольно — это подходящее слово «ограничено»? Он должен использовать Google или что-то подобное, но тогда должна быть возможность редактировать промпты, а это, как я понял из предыдущих обсуждений, невозможно. Значит, мой единственный вариант — перейти на более дорогую модель, если я останусь с OpenAI?


  1. Я бы хотел предоставить такую возможность и своим пользователям, но знаю, что это действительно сложно, поскольку сейчас требуется возможность редактирования опубликованных постов. Если бы он мог действовать в редакторе, это стало бы настоящим прорывом ↩︎

Через несколько недель мы добавим возможность привязать помощника к выделенному персонажу. К тому моменту вы сможете поэкспериментировать с промпт-инжинирингом и посмотреть, сможете ли вы заставить более дешёвые модели вести себя так, как вам нужно.

Тем не менее, я бы порекомендовал попробовать Gemini Flash 2.5. Она очень недорогая (и даже имеет бесплатный тариф) и должна превзойти 4.1 mini.

Вчера оба суммаризатора начали использовать только английский язык на моём форуме. Но поскольку я мог редактировать промпты, для одноязычного форума это было легко исправить. В данном случае формулировка промпта выглядела совершенно правильной, и я бы тоже использовал такую общую формулировку, но ленивая модель OpenAI пошла по лёгкому пути :man_shrugging: