Долгожданный релиз Sora от OpenAI , ИИ-инструмента для создания видео с помощью искусственного интеллекта, наконец состоялся. Система, которая работает по аналогии с генератором изображений DALL-E, позволяет создавать видеоролики высокого разрешения на основе текстовых запросов. Пользователи могут описать желаемую сцену, и Sora сгенерирует полноценное видео. Инструмент также позволяет создавать клипы на основе фотографий, продлевать уже существующие ролики или заполнять отсутствующие кадры, рассказывает SecuriyLab.
Официальный запуск продукта запланирован на 10 декабря, однако доступ к нему получат не все страны. На YouTube-канале компании представители OpenAI сообщили, что первыми Sora смогут воспользоваться пользователи из США и большинства других стран, тогда как для Европы, Великобритании и ряда других регионов сроки запуска пока не определены.
Разработка потребовала много вычислительных ресурсов и гораздо более сложных нейронных сетей, чем те, что используются в DALL-E. Работа над моделью длилась более двух лет. Но оно того стоило. За это время инженеры постарались довести генерацию движений и обработку динамических сцен до идеала (хотя, конечно, в мире технологий предела совершенству нет).
Sora также интегрируется с другими инструментами OpenAI - DALL-E и Codex. Пользователи могут комбинировать текст, изображения и видео в рамках одного проекта.
До сегодняшнего дня доступ был ограничен небольшим кругом тестировщиков, задача которых заключалась в проверке модели на устойчивость к дезинформации, предвзятости и другим потенциальным рискам. Особое внимание уделяется проблеме дипфейков, которые сейчас стали очень популярным инструментом для среди мошенников и провокаторов.
Интерес к Sora подогревает жесткая конкуренция: OpenAI борется за лидерство на рынке генеративного ИИ с такими гигантами, как Google, Meta*, Amazon и Anthropic. Ожидается, что рынок генеративного контента в ближайшие десять лет превысит триллион долларов. Например, Meta ранее представила свой видеогенератор Lumiere, а Amazon выпустила Create with Alexa — инструмент для создания анимационного контента по текстовым запросам.
При этом, как утверждают многие аналитики, Sora выгодно отличается от похожих решений благодаря гибкости настроек. Пользователи могут задавать стиль, атмосферу и тональность видео, варьируя их от гиперреализма до фантазийных концепций.
В дополнение к техническим достижениям, OpenAI усиливает маркетинговую активность. Недавно компания наняла первого в своей истории директора по маркетингу. В октябре они также добавили функцию поиска в ChatGPT, вероятно, чтобы конкурировать с поисковыми системами Google и Bing. Компания также начала сотрудничать с образовательными учреждениями, предлагая интеграцию своих инструментов в учебные программы.
Инцидент спровоцировал дискуссию среди профессионалов о том, как компании, разрабатывающие ИИ, могут наладить более честное и прозрачное сотрудничество с сообществами художников и дизайнеров. На критику OpenAI ничего конкретного не ответила, но пообещала, что продолжит поддерживать творческие сообщества через гранты, мероприятия и другие программы.
Sora представляет собой шаг к созданию мультиформатной платформы OpenAI, объединяющей текст, изображения и видео. Однако стремительное развитие технологий вызывает и новые риски, особенно в контексте политических выборов. По данным компании Clarity, количество дипфейков, созданных с помощью ИИ, увеличилось на 900% за последний год.
Иллюстрация: использованы изображения juicy_fish и Unsplash
Ученые обнаружили, что кофейные отходы повышают прочность бетонных блоков и могут использоваться вместо песка.
Сразу после вступления в должность президент Дональд Трамп подписал несколько важных указов, которые окажут значительное влияние на весь мир.
Нефтяные гиганты сворачивают зеленые проекты и возвращаются к традиционным источникам энергии.
Зарубежные бренды готовятся к празднику Весны в Китае: в саду Юйюань компания LEGO собрала гигантского кота из деталей конструктора.
Компания Tether представила стейблкоин USDT0, призванный устранить барьеры для транзакций. Новости из мира криптовалют.
Культовая компьютерная игра Resident Evil 4 празднует своё двадцатилетие.
Китайские светодиодные экраны для кинотеатров стремительно завоёвывают мировой рынок.