Используя AI-бота в чате, можно общаться с AI текстом, но нельзя рисовать картинки, верно?
Здесь есть что распаковать ![]()
В будущем Gemini получит модальность «текст в изображение». Когда это произойдет, мы сможем просить его генерировать изображения.
Во всех моделях Gemini уже есть модальность изображения для ввода, поэтому, если вы включите зрение для бота и LLM, они будут понимать вставленные вами изображения.
Затем вы сможете использовать Flux, DALL-E или Stable Diffusion для генерации изображений в чате.
Так что… да… оно может нарисовать картинку через инструмент.
Спасибо, Сэм! Я использую бесплатный тариф Gemini 2.0 Flash для общения.
Будет здорово, если в Gemini появится возможность генерации изображений. Когда я пробовал это на сайте Gemini, генерация изображения занимала несколько секунд — не уверен, что это связано с производительностью… Спасибо, с нетерпением жду этого!
Эта функциональность в Gemini была выпущена вчера, мы держим её на контроле.