Камео-режим, мультимодальность и контроль приватности: на что еще способно новое приложение?
OpenAI представила новую версию своей мультимодальной модели для генерации видео и аудио Sora 2, а также одноимённое приложение для iOS с социальными функциями. Первая версия, выпущенная в феврале 2024 года, рассматривалась как пробный шаг в этой области. Теперь разработчики показывают гораздо более высокий уровень реалистичности и управляемости.
Главное новшество — более правдоподобное воспроизведение действий и событий. Если ранние модели иногда обманывали пользователя — объекты могли исчезать или неожиданно менять форму, — то теперь, например, промахнувшийся баскетбольный мяч отскакивает от щита, а гимнаст может оступиться. Такие детали делают сцены более естественными. Кроме того, модель лучше удерживает сюжет: соблюдает стиль, поддерживает согласованность кадров и точнее следует инструкциям. Диапазон возможностей широк — от кинематографичных роликов до анимации, включая звуковое сопровождение и диалоги.
В ролики можно добавлять изображения реальных людей или животных после одноразовой процедуры подтверждения личности. Эта функция открывает новые сценарии использования, но при этом создаёт риски в случае сбоев системы защиты. Компания подчёркивает, что известные люди могут появляться в видео только при их согласии и самостоятельной загрузке материалов.
Приложение Sora построено вокруг функции «камео». Пользователь записывает короткий ролик и голосовой фрагмент, а друзья могут вставлять его образ в сгенерированные сцены. Владелец управляет доступом к этим данным и в любой момент может удалить ролик. Во время внутренних тестов сотрудники отмечали, что функция помогает в неформальном общении. Для широкой аудитории приложение пока запущено в США и Канаде в формате приглашений. Длина клипов ограничена 10 секундами, а пользователи могут комбинировать и изменять ролики в ленте.
Несмотря на очевидное сходство с TikTok, разработчики утверждают, что цель приложения — не бесконечный просмотр, а стимулирование творчества. Лента формируется на основе публикаций знакомых и видео, которые могут вдохновить на собственные эксперименты. Для подростков предусмотрены отдельные настройки: ограничения по времени использования, фильтры персонализации и контроль сообщений через родительский аккаунт ChatGPT.
Компания заявляет, что генерация экстремального или откровенного контента невозможна, но критики напоминают, что такие обещания часто проверяются на прочность, когда платформа масштабируется. На данный момент Sora 2 доступна бесплатно с ограничениями, а подписчики ChatGPT Pro получают расширенную версию на sora.com.