Проблемы ЖКХ зимой: что делать при отключении отопления
07:30
Гороскоп на 6 января: Рак оформляет бумаги, Стрелец берет на себя ответственность
07:00
До перекопки и полива: 3 важных дела на участке весной – сделайте сразу, как сойдет снег
05:11
Без муки и выпечки: вкуснейший десерт за 5 минут – и фигуре не вредит
5 января, 23:12
Ленивые пирожки за 10 минут – когда гости на пороге: без заморочек и очень вкусные
5 января, 22:52
Устойчив к фитофторе и засухе: этот сорт сладких томатов дачники скупают наперегонки
5 января, 19:07
Вы готовите не хуже шеф-повара, если наберете 4/4 — ТЕСТ
5 января, 18:55
Сборы якутского кинематографа достигли исторического максимума в 2024 году
5 января, 17:20
Более 35 тысяч человек обследовали мобильные доктора Якутии в 2024 году
5 января, 17:00
На следующей неделе в Якутске "потеплеет" до -28°
5 января, 16:30
Гороскоп на неделю: Близнецы кардинально меняют свое будущее, Козерог активно общается
5 января, 16:00
Без выпечки и возни с тестом: шоколадный торт за 10 минут — получается нежным и вкусным
5 января, 16:00
Самолет с оборудованием для ремонта сгоревшей котельной вылетел в Жиганский район Якутии
5 января, 15:20
Сoциальные объекты Якутии находятся на особом контроле МЧС России
5 января, 15:00
Глава Якутии встретился с  заслуженным мастером спорта России Василием Егоровым
5 января, 14:20

Новый этап в генерации AI-видео: Сбер представляет обновленную модель Kandinsky Video

Нейросеть поможет пользователям реализовывать свои самые смелые творческие задумки
13 декабря 2024, 14:25 Бизнес
Сбербанк Александр Тен, ИА SakhalinMedia
Сбербанк
Фото: Александр Тен, ИА SakhalinMedia
Нашли опечатку?
Ctrl+Enter

Сбер представил на международной конференции AI Journey (16+) бета-версию нейросети нового поколения Kandinsky 4.0 Video (12+) для создания реалистичных видеороликов по текстовому описанию или стартовому кадру. Нейросеть могут использовать как обычные пользователи, чтобы создать анимированные ролики с поздравлением близких людей, так и дизайнеры, маркетологи, мультипликаторы, для которых Kandinsky может стать помощником в генерации трейлеров и клипов. Об этом сообщает ИА IrkutskMedia со ссылкой на пресс-службу банка. 

"За год с момента релиза первой версии модели Kandinsky Video на AI Journey 2023 наша команда значительно улучшила такие показатели, как качество и скорость генерации полноценных видеороликов, открывая тем самым безграничные горизонты для креатива, а также продуктовых применений модели. Теперь каждый пользователь новой версии Kandinsky Video может воплотить свои идеи и выразить их в видеоформате. Мы всегда рады видеть, как наши технологии помогают людям реализовывать свои самые смелые творческие задумки. При этом всё ближе то время, когда искусственный интеллект будет способен решать множество задач сразу, причем с самыми разными типами данных и в разных доменах. И такие модели как Kandinsky Video способствуют мировому развитию в этом важном направлении, значительно приближая современные технологии к тому синергетическому уровню обработки, восприятия и создания информации, каким обладает человек", — сказал старший вице-президент, руководитель блока "Технологическое развитие" Сбербанка Андрей Белевцев. 

Продолжительность и разрешение

Теперь модель генерирует видеоряд продолжительностью до 12 секунд в разрешении HD (1280x720) по любому текстовому описанию или произвольному стартовому кадру. С помощью модели можно создавать видео с разным соотношением сторон под любые пользовательские и продуктовые потребности.

Качество и реалистичность

Важнейшими отличительными свойствами новой модели являются улучшенное визуальное качество — высокий контраст и чёткость кадров, выстраивание общей композиции сцены, и реалистичность движений генерируемых объектов. Добиться такого качества позволило уникальное сотрудничество научных и инженерных команд, которые вместе работали как над развитием архитектуры новой модели, так и над сбором и фильтрацией данных для обучения. 

В дополнение к основной модели команда Kandinsky представила быструю версию Kandinsky 4.0 Video Flash (12+), которая генерирует видеоряд продолжительностью до 12 секунд в разрешении 480p (720x480) по любому текстовому описанию всего за 15 секунд.

Kandinsky 4.0 Video — это ансамбль моделей, главная часть которого является диффузионным трансформером с 5 млрд параметрами. Инженеры команды Kandinsky использовали самые передовые алгоритмы и способы оптимизации обучения больших моделей, что позволило эффективно выучить модель такого размера на огромных массивах видео. Модель разработали и обучили исследователи Sber AI при партнёрской поддержке учёных из Института AIRI на объединённом датасете Сбера.

Первыми доступ к новой версии Kandinsky Video получат представители креативных индустрий — художники, дизайнеры и кинематографисты. Для них модель будет доступна в рамках инструмента, который даёт его пользователям возможность генерировать полноценные мини-фильмы — со сценарием, полноценным видеорядом и звуковым сопровождением. Для широкой аудитории нейросеть будет доступна в 1Q 2025 года. 

Реклама. Рекламодатель: ПАО "Сбербанк".

190699
55
74