Популярный инструмент наконец превратился в бронированный сейф.

OpenAI объявила о запуске новых механизмов защиты в ChatGPT, которые нацелены на снижение рисков при работе с внешними источниками и подключёнными сервисами. Компания усиливает контроль над тем, как модель взаимодействует с сетью и приложениями, и одновременно вводит более наглядную маркировку функций с повышенным уровнем угроз.
Главным нововведением стал режим Lockdown Mode (режим блокировки) — дополнительная опция безопасности для пользователей, которые чаще других становятся целями сложных атак. Речь идёт о руководителях, командах защиты и сотрудниках крупных организаций. Этот режим жёстко ограничивает внешние взаимодействия ChatGPT и снижает вероятность утечки данных через атаки с внедрением вредоносных инструкций в запросы.
При включении Lockdown Mode система строго отключает ряд инструментов и сценариев, которые злоумышленники могут использовать для вывода чувствительной информации. Просмотр веб-страниц работает только через закрытый кэш — без прямых сетевых запросов наружу. Часть функций полностью блокируется, если нельзя гарантировать сохранность данных на техническом уровне. Режим дополняет уже действующие меры — изоляцию среды выполнения, защиту от утечки через ссылки, журналы аудита и разграничение ролей в корпоративных версиях сервиса. Подробнее о природе атак с внедрением вредоносных инструкций в LLM-системы.
Настройка доступна в тарифах ChatGPT Enterprise, Edu, Healthcare и Teachers. Администраторы рабочих пространств могут назначать специальные роли и отдельно определять, какие приложения и действия внутри них разрешены даже при жёстких ограничениях. Для контроля активности применяется платформа журналов соответствия, которая показывает обращения к приложениям и источникам данных. Для массовых пользователей запуск режима запланирован позже.
Параллельно OpenAI ввела единый ярлык Elevated Risk — «повышенный риск» — для функций, где подключение к сети или внешним сервисам увеличивает поверхность атаки. Такая маркировка появилась в ChatGPT, ChatGPT Atlas и Codex. Обозначение сопровождается пояснением, какие именно угрозы возникают и в каких случаях включение опции оправдано.
В Codex, инструменте для программирования, метка отображается рядом с настройками сетевого доступа агента. Разработчик может разрешить обращения к сайтам и документации, но интерфейс предупреждает о возможных последствиях. Там же задаётся список допустимых доменов и HTTP-методов.
В OpenAI сообщили, что по мере усиления встроенных защит пометка повышенного риска будет убираться с тех функций, где угрозы удалось существенно сократить. Список возможностей с таким обозначением также планируют регулярно пересматривать.