Генеративный ИИ может стать более активным благодаря этому дикому стабильному обновлению Diffusion

Stability AI, разработчик Stable Diffusion, представляет новый генеративный искусственный интеллект, который может создавать короткие видеоролики с текстовой подсказкой.
Удачно названный «Стабильное распределение видео», он состоит из двух моделей искусственного интеллекта (известных как SVD и SVD-XT) и может создавать клипы с разрешением 576 x 1024 пикселей. Пользователи могут настроить частоту кадров так, чтобы она составляла от трех до 30 кадров в секунду. Продолжительность видеороликов зависит от того, какая из моделей-близнецов выбрана. При выборе SVD контент будет воспроизводиться в течение 14 кадров, а SVD-XT немного расширяет его до 25 кадров. Длина не имеет большого значения, поскольку, согласно официальному списку Hugging Face, отрендеренные клипы воспроизводятся всего около четырех секунд, а затем заканчиваются.
Компания разместила на своем канале YouTube видео, демонстрирующее возможности Stable Video Diffusion, и контент оказался на удивление высокого качества. Они определенно не являются тем кошмарным топливом, которое вы видите на других устройствах, подобных AI, Make-A-Video от Meta. На наш взгляд, наиболее впечатляющей является демо-версия Ice Dragon. Вы можете увидеть множество деталей в чешуе дракона, а горы сзади выглядят как сошедшие с картины. Анимация, как вы понимаете, весьма ограничена, поскольку объект может лишь медленно двигать головой. То же самое можно увидеть и в других демо. Это медленный цикл ходьбы или медленный панорамный снимок.
На этом ограничения не заканчиваются. Сообщается, что стабильное распространение видео не может обеспечить «идеальный фотореализм», не может генерировать «читабельный текст» и испытывает трудности с изображением лиц. Другая демонстрация на сайте Stability AI показывает, что модель способна отображать лицо мужчины без каких-либо странных недостатков, поэтому это можно рассматривать в каждом конкретном случае.
Обратите внимание, что этот проект все еще находится на ранней стадии. Очевидно, что модель пока не готова к широкому выпуску, и планов это делать нет. Стабильность AI подчеркивает, что стабильное распространение видео в настоящее время не предназначено «для реальных или коммерческих приложений». Фактически, в настоящее время он «предназначен только для исследовательских целей». Нас не удивляет, что разработчик очень бережно относится к своей технологии. В прошлом году произошел инцидент, когда модель Stability Diffusion просочилась в сеть, что привело к тому, что злоумышленники использовали ее для создания глубоких фейковых изображений.
Если вы хотите попробовать Stable Video Diffusion, вы можете записаться в список ожидания, заполнив форму на сайте компании. Неизвестно, когда людей пустят, но предварительный просмотр будет включать интерфейс преобразования текста в видео. А пока вы можете просмотреть Белую книгу по искусственному интеллекту и узнать больше обо всех деталях проекта.
После ознакомления с документом мы нашли интересным то, что в нем упоминается использование «общедоступных наборов видеоданных» в рамках учебных материалов. Опять же, неудивительно слышать это, учитывая, что Getty Images подала в суд на Stability AI после обвинений в сборе данных в начале этого года. Похоже, команда стремится быть более осторожной, чтобы не нажить больше врагов.
Пока нет информации о том, когда выйдет Stable Video Diffusion. К счастью, есть и другие варианты. Ознакомьтесь со списком лучших создателей искусственного интеллекта на 2023 год по версии Ny Breaking.

Первоисточник: : https://nybreaking.com/category/tech/

Понравилась статья? Поделиться с друзьями:
Интересно о полезном
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!:

Этот сайт использует Akismet для борьбы со спамом. Узнайте, как обрабатываются ваши данные комментариев.