Генеративный ИИ может стать более активным благодаря этому дикому обновлению Stable Diffusion.

Stability AI, разработчик Stable Diffusion, представляет новый генеративный , который может создавать короткие видеоролики с текстовой подсказкой.

Удачно названный Stable Video Diffusion, он состоит из двух моделей искусственного интеллекта (известных как SVD и SVD-XT) и способен создавать клипы с разрешением 576 x 1024 пикселей. Пользователи смогут настроить частоту кадров в диапазоне от 3 до 30 кадров в секунду. Продолжительность видеороликов зависит от того, какая из моделей-близнецов выбрана. Если вы выберете SVD, контент будет воспроизводиться в течение 14 кадров, а SVD-XT немного увеличит его до 25 кадров. Продолжительность не имеет большого значения, поскольку отрендеренные клипы будут воспроизводиться всего около четырех секунд до завершения, согласно официальному списку Hugging Face.

Компания разместила на своем канале YouTube видео, демонстрирующее, на что способна Stable Video Diffusion, и контент на удивление высокого качества. Они определенно не являются тем кошмарным топливом, которое вы видите на других ИИ, таких как Make-A-Video от Meta. Самым впечатляющим, на наш взгляд, является демо-версия Ice Dragon. Вы можете увидеть большое количество деталей в чешуе дракона, а горы сзади выглядят как будто сошедшие с картины. Анимация, как вы понимаете, довольно ограничена, поскольку объект может лишь медленно покачивать головой. То же самое можно увидеть и в других демо. Это либо медленный цикл ходьбы, либо медленный панорамный снимок.

На ранних стадиях

На этом ограничения не заканчиваются. Сообщается, что Stable Video Diffusion не может «достичь идеального фотореализма», не может генерировать «разборчивый текст», плюс у него проблемы с лицами. Еще одна демонстрация на веб-сайте Stability AI показывает, что ее модель способна отображать лицо мужчины без каких-либо странных недостатков, поэтому это может быть сделано в индивидуальном порядке.



Имейте в виду, что этот проект все еще находится на ранней стадии. Очевидно, что модель не готова к широкому выпуску и не планирует этого делать. Stability AI подчеркивает, что Stable Video Diffusion в настоящее время не предназначен «для реальных или коммерческих приложений». Фактически, в настоящее время он «предназначен только для исследовательских целей». Мы не удивлены, что разработчик очень осторожен со своими технологиями. В прошлом году произошел инцидент, когда модель Stability Diffusion просочилась в сеть, что привело к тому, что злоумышленники использовали ее для создания глубоких фейковых изображений.

Доступность

Если вы хотите попробовать Stable Video Diffusion, вы можете войти в список ожидания, заполнив форму на сайте компании. Неизвестно, когда людей пустят, но предварительная версия будет включать интерфейс преобразования текста в видео. А пока вы можете ознакомиться с официальным документом ИИ и узнать все подробности проекта.

Покопавшись в документе, мы нашли интересную вещь: в нем упоминается использование «общедоступных наборов видеоданных» в качестве учебного материала. Опять же, неудивительно слышать это, учитывая, что Getty Images подала в суд на Stability AI из-за обвинений в сборе данных в начале этого года. Похоже, команда стремится быть осторожнее, чтобы не нажить больше врагов.

Пока нет информации о том, когда выйдет Stable Video Diffusion. К счастью, есть и другие варианты. Обязательно ознакомьтесь со списком лучших производителей видео с использованием искусственного интеллекта на 2023 год по версии TechRadar.

Вам также может понравиться