OpenAl Sora: искусственный интеллект создаёт видео из текста

OpenAl Sora

OpenAI представила Sora, искусственный интеллект, создающий фотореалистичное видео из текста, что предвещает захватывающее и сюрреалистическое будущее.

OpenAI Sora

OpenAI представила Sora — модель искусственного интеллекта для преобразования текста в видео, которая может генерировать фотореалистичные HD-видео на основе письменных описаний.

Хотя исследования все еще находятся на предварительной стадии и модель не была полностью протестирована, исходя из полученных результатов, Sora, как говорят, уже превосходит существующие модели текстового видео как с точки зрения точности, так и последовательности. Он также создает 60-секундные видеоролики, которые почти полностью неотличимы от реальных кадров. Неудивительно, что эта технология сразу же вызвала беспокойство у многих. Ведь если записи неотличимы от реальности, полностью фейковые видеоролики могут распространиться повсеместно за считанные секунды. И это поднимает дополнительные вопросы о доверии к онлайн-контенту.

Эта разработка бросает вызов традиционному представлению о том, что фотореалистичные видеоролики записываются камерами. Сора фактически стирает грань между правдой и вымыслом. Легкость, с которой Сора создает реалистичные видеоролики, может представлять серьезную угрозу подлинности онлайн-контента и исторических материалов.

Концепция культурной сингулярности, где правда и вымысел становятся неразличимыми, ближе, чем мы думали до сих пор.

Вот как работает OpenAl Sora

OpenAl Sora использует так называемую диффузионную модель, аналогичную другим моделям ИИ. Это используется, например, DALL-E 3 и Stable Diffusion. Генерирует видео путем постепенного преобразования шума, распознает объекты и понятия по заданным инструкциям. Модель достигает временной согласованности, предвидя несколько кадров одновременно, что обеспечивает непрерывность даже тогда, когда объект временно исчезает из поля зрения. OpenAI визуализирует видео как наборы блоков данных, позволяя обучать диффузионных преобразователей различным визуальным данным, включая продолжительность, разрешение и соотношение сторон.

Ключевым элементом подхода OpenAI является совместное использование моделей искусственного интеллекта с предыдущими моделями. Сора эффективно следует инструкциям благодаря текстам, генерируемым другой моделью искусственного интеллекта, такой как GPT-4V. OpenAI рассматривает Sora как основу для моделей, которые могут понимать и моделировать реальный мир, что является важным шагом на пути к созданию общего искусственного интеллекта (AGI).

Многие люди обеспокоены ИИ

Несмотря на технический прогресс, по-прежнему существуют опасения по поводу возможного неправильного использования этой технологии. OpenAI не раскрыла конкретный набор данных, используемый для обучения Соры, предполагая, что они, возможно, использовали синтетические видеоданные из движка видеоигры, а также реальные источники видео. Поскольку общество борется с последствиями контента, созданного ИИ, сохраняются серьезные этические и фидуциарные опасения по поводу ответственности.

Хотя мы восхищаемся новаторским развитием OpenAI, крайне важно увидеть и другую сторону. Эта технология бросает вызов основам нашего доверия к визуальному контенту. Способность Соры создавать гиперреалистичные видеоролики из нескольких строк текста полностью стирает грань между фактом и вымыслом. В мире, где мы не всегда можем верить тому, что видим, дифференциация становится самым важным.

Добавить комментарий