Психоз, суицид и 560 тысяч пользователей. Новая модель GPT-5.1 научилась эмпатии. Но не стала безопаснее.

Психоз, суицид и 560 тысяч пользователей. Новая модель GPT-5.1 научилась эмпатии. Но не стала безопаснее.

OpenAI делает ИИ «дружелюбнее», но эксперты напоминают: тепло исходит лишь от серверов

image

Компания OpenAI представила обновлённую версию своей модели — GPT-5.1, которую она называет «теплее», разговорнее и более естественной в общении. Новая версия, по утверждению компании, лучше понимает инструкции и звучит «ближе к человеку» — даже когда речь заходит о темах вроде секса, насилия и психического здоровья.

Модель вышла в двух вариантах: GPT-5.1 Instant — «теперь теплее, умнее и лучше следует указаниям», и GPT-5.1 Thinking — «улучшенная версия для сложных рассуждений, быстрее на простых задачах и устойчивее при сложных». Доступ к ней получили только платные подписчики, тогда как пользователи бесплатного уровня продолжают работать с GPT-5 (gpt-5-instant-aug15 и обновлением gpt-5-instant-oct3).

«Мы чётко услышали от пользователей: хороший ИИ должен быть не только умным, но и приятным в общении», — говорится в заявлении компании. — «GPT-5.1 значительно улучшает как интеллект, так и стиль коммуникации».

OpenAI добавила новые инструменты для управления тоном ответов — теперь ChatGPT можно «настроить под себя» с помощью более гибких ползунков. В августе при выпуске GPT-5 компания представила четыре базовые «личности» чатбота: Cynical, Robot, Listener и Nerd. В новой версии их переименовали — теперь это Cynic, Efficient, Friendly и Nerd, а также добавили три новых режима: Professional, Candid и Quirky.

OpenAI подчёркивает, что изменения в стиле не делают ИИ излишне угодливым или «подхалимским», как это уже случалось ранее. Тогда компания отдельно объясняла, что корректировка тона не должна влиять на критичность суждений модели.

Пример разницы в подаче компания показала на одинаковом запросе пользователя. GPT-5 отвечала сухо:

«Вот несколько простых способов справиться со стрессом…»

А GPT-5.1 Instant начинала разговор иначе:

«Я с тобой, Рон — это абсолютно нормально, особенно с учётом того, что у тебя происходит. Вот несколько способов расслабиться…»

Такой эмоциональный стиль уже стал предметом юридических разбирательств. В августе OpenAI оказалась ответчиком по делу о самоубийстве подростка в Калифорнии, после чего было подано ещё четыре аналогичных иска, где истцы утверждают, что чрезмерно «сочувствующий» чатбот способствовал формированию эмоциональной зависимости у пользователей.

В октябре OpenAI сообщила, что около 0,07% активных пользователей и 0,01% сообщений в неделю могут указывать на психические кризисы вроде психоза или мании. С учётом примерно 800 млн активных пользователей это около 560 тысяч человек еженедельно.

Однако, по данным системной карты GPT-5.1, новая версия показывает ухудшение в некоторых внутренних метриках: в частности, при обработке тем, связанных с оскорблениями, ненавистническими высказываниями и сексуальным контентом. При этом GPT-5.1 Instant демонстрирует более слабые результаты по сравнению с октябрьским обновлением GPT-5 в вопросах «эмоциональной зависимости» и контента о насилии.

Компания признаёт эти регрессии, но отмечает, что они незначительны и зависят от статистической достоверности тестов. Как и во многих исследованиях ИИ-бенчмарков, результаты могут колебаться в зависимости от методологии.

Внешние оценки пока не опубликованы, но OpenAI утверждает, что GPT-5.1 показывает «значительный рост» в задачах по математике и программированию, включая AIME 2025 и Codeforces, благодаря внедрению adaptive reasoning — механизма, который позволяет модели гибко регулировать глубину анализа в зависимости от сложности вопроса.

Компания уточняет, что GPT-5.1 Thinking «адаптирует своё рассуждение под задачу»: тратит больше времени на сложные запросы и отвечает быстрее на простые. Это должно снизить риск «переобдумывания» — эффекта, когда модели начинают ошибаться от избыточной аналитики.