Stable Diffusion 3: на пороге новой эры визуализации текста

13:52 / 23 февраля, 2024 9045

Новая версии модели стирает границы цифрового искусства на любом устройстве.

Компания Stability AI объявила о запуске предварительной версии Stable Diffusion 3 — усовершенствованной модели преобразования текста в изображение, которая стала более производительной и точной.

Stable Diffusion 3 выделяется на фоне предыдущих версий благодаря существенным улучшениям: модель лучше справляется с созданием изображений, на которых нужно изобразить несколько объектов, генерирует картинки лучшего качества и точнее пишет тексты.

Примеры генерации Stable Diffusion 3

Пока что доступ к модели ограничен, но разработчики предлагают зарегистрироваться в списке ожидания для участия в раннем тестировании. Этот этап является ключевым для сбора отзывов, которые помогут улучшить функциональность и безопасность продукта перед его публичным релизом.

Новая линейка Stable Diffusion 3 включает модели с количеством параметров от 800 миллионов до 8 миллиардов, что предоставляет пользователям широкие возможности выбора в зависимости от требований к масштабируемости и качеству, а также позволяет адаптировать разные версии модели для работы на различных устройствах — от смартфонов до серверов.

Как заявил гендиректор Stability AI Эмад Мостак, модель основана на комбинации архитектуры диффузионного трансформера и метода сопоставления потоков (flow matching). Техника flow matching предназначена для того, чтобы плавно переходить от случайного шума к структурированному изображению без необходимости симулировать каждый шаг процесса. Более подробно о технических нововведениях в Stable Diffusion 3 будет рассказано в предстоящем отчете.

Компания уделяет большое внимание безопасности и ответственному использованию ИИ, внедряя меры для предотвращения его злоупотребления. Безопасность обеспечивается на всех этапах работы с моделью: от её обучения до тестирования, оценки и внедрения. В рамках подготовки к раннему доступу был реализован ряд защитных механизмов.

Как заявляет Stability AI, основной целью компании является обеспечение открытого, безопасного и доступного для всех использования генеративного ИИ. С помощью Stable Diffusion 3 стремятся предложить гибкие решения, которые позволят каждому раскрыть свой творческий потенциал, в полной мере соответствуя миссии активизации человеческих возможностей.

Для интересующихся коммерческим использованием других моделей генерации изображений до официального выхода Stable Diffusion 3 предлагается ознакомиться с условиями членства в Stability AI для самостоятельного размещения или использовать платформу разработчиков для доступа к API.

ГАРДА

«Гарда»: ручные расследования – главная боль ИБ

Узнайте, какие решения для активного реагирования на угрозы востребованы на рынке.

Скачать исследование

Реклама. 16+ ООО «Гарда Технологии» ИНН 5260443081

Взлом по подписке: ИИ-агенты против вашего мобильного приложения

Stable Diffusion 3: на пороге новой эры визуализации текста

Подпишитесь на email рассылку