Сбер представил бесплатную бета-версию нейросети Kandinsky Video 1.1 для создания полноценных видеороликов по текстовому описанию и изображению.
Формат сгенерированного видео — это непрерывная сцена с движением и объекта, и фона. Модель генерирует видеоряд продолжительностью до шести секунд с частотой 8 и 32 кадра в секунду. С обновлённым Kandinsky Video можно создавать видео в разных форматах — 16:9, 9:16 или 1:1.
Новая версия модели позволяет генерировать видео не только по тексту, но и по изображению, то есть «оживлять» статичную картинку. Благодаря этому у пользователей появилось ещё больше возможностей для креатива и реализации своих творческих задумок любой направленности. Кроме того, в новой версии модели можно контролировать динамику генерируемого видео с помощью специального параметра motion score.
Андрей Белевцев, старший вице-президент, руководитель блока «Технологическое развитие» Сбербанка, отметил: «Сегодня мы сделали ещё один шаг в будущее видеотворчества. Теперь каждый пользователь Kandinsky Video может воплотить свои идеи и выразить их в видеоформате. С момента запуска первой версии нейросети прошло менее года, и за это время наша команда значительно улучшила такие показатели, как качество и скорость генерации полноценных видеороликов, открывая тем самым безграничные горизонты для креатива. Мы всегда рады видеть, как наши технологии помогают людям реализовывать свои самые смелые творческие задумки».
Оценить возможности нейросети Kandinsky Video можно на платформе fusionbrain.ai и в официальном Telegram-боте Kandinsky.
Уникальная архитектура была разработана и обучена исследователями Sber AI при партнёрской поддержке учёных из Института искусственного интеллекта AIRI на объединённом датасете Sber AI и компании SberDevices.