Возможности Sora

Долгожданный релиз Sora от OpenAI , ИИ-инструмента для создания видео с помощью искусственного интеллекта, наконец состоялся. Система, которая работает по аналогии с генератором изображений DALL-E, позволяет создавать видеоролики высокого разрешения на основе текстовых запросов. Пользователи могут описать желаемую сцену, и Sora сгенерирует полноценное видео. Инструмент также позволяет создавать клипы на основе фотографий, продлевать уже существующие ролики или заполнять отсутствующие кадры, рассказывает SecuriyLab.

Официальный запуск продукта запланирован на 10 декабря, однако доступ к нему получат не все страны. На YouTube-канале компании представители OpenAI сообщили, что первыми Sora смогут воспользоваться пользователи из США и большинства других стран, тогда как для Европы, Великобритании и ряда других регионов сроки запуска пока не определены.

sora_-1+++cn+++.jpg

Разработка потребовала много вычислительных ресурсов и гораздо более сложных нейронных сетей, чем те, что используются в DALL-E. Работа над моделью длилась более двух лет. Но оно того стоило. За это время инженеры постарались довести генерацию движений и обработку динамических сцен до идеала (хотя, конечно, в мире технологий предела совершенству нет).

Инструмент будет доступен в рамках существующих подписок ChatGPT - Plus и Pro. За дополнительные функции доплачивать не нужно. В прямом эфире генеральный директор OpenAI, Сэм Альтман, вместе с командой продемонстрировали основные возможности их детища, включая функцию «Blend», которая объединяет два видеофрагмента, а также возможность создания бесконечно повторяющихся видеороликов.

Sora также интегрируется с другими инструментами OpenAI - DALL-E и Codex. Пользователи могут комбинировать текст, изображения и видео в рамках одного проекта.

До сегодняшнего дня доступ был ограничен небольшим кругом тестировщиков, задача которых заключалась в проверке модели на устойчивость к дезинформации, предвзятости и другим потенциальным рискам. Особое внимание уделяется проблеме дипфейков, которые сейчас стали очень популярным инструментом для среди мошенников и провокаторов.

Интерес к Sora подогревает жесткая конкуренция: OpenAI борется за лидерство на рынке генеративного ИИ с такими гигантами, как Google, Meta*, Amazon и Anthropic. Ожидается, что рынок генеративного контента в ближайшие десять лет превысит триллион долларов. Например, Meta ранее представила свой видеогенератор Lumiere, а Amazon выпустила Create with Alexa — инструмент для создания анимационного контента по текстовым запросам.

При этом, как утверждают многие аналитики, Sora выгодно отличается от похожих решений благодаря гибкости настроек. Пользователи могут задавать стиль, атмосферу и тональность видео, варьируя их от гиперреализма до фантазийных концепций.

В дополнение к техническим достижениям, OpenAI усиливает маркетинговую активность. Недавно компания наняла первого в своей истории директора по маркетингу. В октябре они также добавили функцию поиска в ChatGPT, вероятно, чтобы конкурировать с поисковыми системами Google и Bing. Компания также начала сотрудничать с образовательными учреждениями, предлагая интеграцию своих инструментов в учебные программы.

Не обходится и без критики. Группа художников, участвовавших в программе раннего доступа, заявила, что OpenAI эксплуатирует их труд без должной компенсации. В открытом письме, подписанном 300 тестировщиками, отмечается: на совершенствование модели они потратили много сил и времени, а вознаграждение оказалось просто смешным. Согласно документу, истцы чувствуют себя инструментом для пиара, а не полноценными партнерами проекта.

Инцидент спровоцировал дискуссию среди профессионалов о том, как компании, разрабатывающие ИИ, могут наладить более честное и прозрачное сотрудничество с сообществами художников и дизайнеров. На критику OpenAI ничего конкретного не ответила, но пообещала, что продолжит поддерживать творческие сообщества через гранты, мероприятия и другие программы.

Sora представляет собой шаг к созданию мультиформатной платформы OpenAI, объединяющей текст, изображения и видео. Однако стремительное развитие технологий вызывает и новые риски, особенно в контексте политических выборов. По данным компании Clarity, количество дипфейков, созданных с помощью ИИ, увеличилось на 900% за последний год.


Meta*, в том числе ее продукты Facebook и Instagram, признана экстремистской организацией в России

Иллюстрация: использованы изображения juicy_fish и Unsplash

12.12.2024
Важное

Ученые обнаружили, что кофейные отходы повышают прочность бетонных блоков и могут использоваться вместо песка.

22.01.2025 17:00:00

Сразу после вступления в должность президент Дональд Трамп подписал несколько важных указов, которые окажут значительное влияние на весь мир.

22.01.2025 13:00:00

Нефтяные гиганты сворачивают зеленые проекты и возвращаются к традиционным источникам энергии.

22.01.2025 09:00:00
Другие События

Зарубежные бренды готовятся к празднику Весны в Китае: в саду Юйюань компания LEGO собрала гигантского кота из деталей конструктора.

Компания Tether представила стейблкоин USDT0, призванный устранить барьеры для транзакций. Новости из мира криптовалют.

Культовая компьютерная игра Resident Evil 4 празднует своё двадцатилетие.

Китайские светодиодные экраны для кинотеатров стремительно завоёвывают мировой рынок.