Kandinsky научился собирать картинку из трёх фото и убирать лишнее кистью
Сбербанк добавил в «ГигаЧат» три новых функции на базе Kandinsky 6.0: генерацию из нескольких фото, редактирование кистью и автоподбор формата.
Сбербанк обновил нейросетевой инструмент для работы с изображениями в «ГигаЧате». Теперь в основе — модель Kandinsky 6.0 Image с тремя новыми функциями.
Несколько фото — одна картинка. Можно загрузить до трёх изображений и одним запросом собрать из них что-то новое. Нейросеть сама разбирается, что взять из каждого: стиль с одного фото, персонажа с другого, фон с третьего. Полезно, если нужно один раз «зафиксировать» героя и потом помещать его в разные сцены.
Редактирование кистью. Раньше, чтобы убрать лишнего человека с фотографии или заменить фоновый объект, нужно было словами объяснять нейросети, где именно что-то не так. Теперь можно просто обвести область кистью и указать: удалить или заменить. Точность выше, правок меньше.
Авто-формат. Модель сама подбирает соотношение сторон под тип изображения. Портрет — вертикальный кадр, панорама — горизонтальный, обложка — квадрат. Или можно написать назначение: «баннер», «аватар», «пост для блога» — и формат подтянется сам.
Денис Димитров, CTO Kandinsky и управляющий директор по исследованию данных Сбербанка, объясняет логику так: «Чем меньше технических барьеров стоит между идеей и результатом, тем больше людей могут реализовывать свои замыслы».
Новые инструменты ориентированы на дизайнеров интерьеров, маркетологов, создателей контента и всех, кто регулярно работает с визуалом, но не хочет разбираться в профессиональных программах вроде Photoshop.
Функции уже доступны в «ГигаЧате».