Подробный обзор ChatGPT 5

Подробный обзор ChatGPT 5

OpenAI официально выпустил ChatGPT 5 — новую модель по умолчанию в самом ChatGPT и целую линейку GPT‑5 в API. Под капотом — унифицированная система с роутером, который сам решает, отвечать быстро или «думать» подольше, а на выходе — заметно меньше галлюцинаций и больше полезных возможностей: код, тексты, здоровье, мультимодальность. Ниже разбираем, что именно изменилось, сколько стоит и кому это всё нужно. Официальная новость , лендинг , релиз-ноуты .

Что такое GPT‑5 и чем он отличается

GPT‑5 — это не одна модель, а унифицированная система: быстрый «основной» модельный трек для типовых запросов, «думающий» трек GPT‑5 Thinking для сложных задач и реальный роутер, который переключает режимы по контексту и вашему намерению (вплоть до прямой подсказки «подумай основательно» в промпте). В ChatGPT это работает «под капотом», а в API вы отдельно выбираете нужные варианты. Идея простая: поменьше ручной возни с выбором модели, побольше качества там, где без рассуждений никак. Системная карта описывает архитектуру и поведение роутера.

На практике это означает и ощутимый прирост точности: на свежих метриках вроде AIME‑2025 (математика), SWE‑bench Verified (реальные задачи по разработке), MMMU (мультимодальность) и HealthBench (медицина) GPT‑5 показывает state‑of‑the‑art, а не просто «немного лучше». И это чувствуется в обычном использовании — от писем и отчётов до сложных запросов с цепочками инструментов. Детали и цифры .

Ключевые улучшения (и зачем вам это)

Меньше галлюцинаций и «угождательства». GPT‑5 примерно на 45% реже ошибается по фактам, чем GPT‑4o, а в режиме «мышления» — заметно честнее признаёт ограничения вместо того, чтобы «сделать вид, что всё получилось». В системной карте отдельный раздел посвящён снижению «deception» в задачах с отсутствующими файлами/картинками, поломанными инструментами и т. п. — там фиксируется падение доли обманчивых ответов с ~4.8% у o3 до ~2.1% у GPT‑5 Thinking.

Письмо и творчество. Модель лучше держит стиль и форму (даже свободный стих и сложные ритмы), корректнее «схватывает» культурные контексты и избегает банальностей. Да, это субъективно — но сравнения ответов 4o vs 5 в блоге выглядят убедительно.

Код и «агентность». GPT‑5 сильнее во фронтенде, устойчивее в длинных цепочках инструментов и точнее в следовании инструкциям: меньше нарушает контекст, реже теряет шаг в длинной задаче, лучше справляется с ошибками инструментов. Для реальных бэкенд/фронтенд задач это означает меньше микроменеджмента промпта и больше результата «с первого раза».

Здоровье. На HealthBench (включая «Hard») у GPT‑5 самый высокий результат среди моделей OpenAI. Важно: модель не заменяет врача, но лучше помогает формулировать вопросы, уточнять риски и понимать результаты анализов.

Что нового внутри самого ChatGPT

Главное — GPT‑5 стал моделью по умолчанию для всех залогиненных пользователей, плюс есть переключатель на GPT‑5 Thinking и GPT‑5 Pro в платных тарифах. Появились персональности (Cynic, Robot, Listener, Nerd), цветовые акценты интерфейса, «Study mode» для интерактивного обучения и заметные обновления Voice. Если говорить простым языком: ChatGPT стал гибче и «человечнее», но при этом более управляемым. Смотрите релиз‑ноуты .

  • Развёртывание и доступность: GPT‑5 постепенно включают по всему миру в планах Free/Plus/Pro/Team; Enterprise/Edu — на подходе. В Team уже доступен, для Enterprise/Edu обещана дата включения в середине августа.
  • Voice: пока работает на GPT‑4o (да, это всё ещё смешанный сетап).
  • Коннекторы и поиск: чат‑поиск и «deep research» коннекторы расширяются, но в ряде интеграций есть ограничения по регионам (ЕЭЗ, Швейцария, Британия). Подробности в нотах .

Разработчикам: GPT‑5 в API

В API можно выбрать размер под задачу: gpt‑5, gpt‑5‑mini и gpt‑5‑nano. Это версия для разработчиков с акцентом на код и агентные сценарии; она отличается от «нерезонирующего» слоя в ChatGPT (под это есть отдельная gpt‑5‑chat‑latest). Появились новые рычажки — reasoning_effort с режимом minimal (отвечать быстрее, «думая» меньше) и параметр verbosity (low/medium/high) для контроля объёма ответа. Плюс — «custom tools» с plaintext вместо JSON, если так удобнее для оболочки. Анонс для разработчиков .

Контекст и лимиты

В API у всей линейки GPT‑5 суммарный контекст — до 400K токенов: максимум ~272K на вход и до 128K на вывод (включая «reasoning tokens»). Этого уже хватает на объёмные репозитории, длинные исследования или большие юридические документы в рамках одного контекстного окна.

Цены

  • GPT‑5: вход $1.25 за 1M токенов (cached — $0.125), выход $10 за 1M токенов.
  • GPT‑5 mini: вход $0.25 (cached — $0.025), выход $2.
  • GPT‑5 nano: вход $0.05 (cached — $0.005), выход $0.40.

Актуальные цены всегда смотрите на странице Pricing — там же есть детали про Batch API (‑50% к стоимости) и приоритетную обработку.

Про производительность и сценарии

  • Код: 74.9% на SWE‑bench Verified и 88% на Aider Polyglot; лучше фронтенд‑генерация и сотрудничество с инструментами (Cursor, Windsurf, Copilot, и др.).
  • Агентность и вызов инструментов: новые рекорды в τ²‑bench telecom, устойчивые длинные цепочки действий, аккуратные пояснения между вызовами инструментов.
  • Длинный контекст: лучше извлечение фактов и ко‑референция на внутренних бенчмарках (OpenAI‑MRCR, BrowseComp LC).

Безопасность: от «жёстких отказов» к safe‑completions

Вместо упора на «отказать/выполнить» OpenAI учит GPT‑5 давать максимально полезный, но безопасный ответ прямо внутри «зелёной зоны». Это особенно важно для двояких тем (биология, кибербезопасность), где можно и помочь, и навредить. В блоге приводят показательные кейсы: o3 иногда «перегибал» и выдавал слишком конкретные инструкции, тогда как GPT‑5 корректно ограничивает детализацию и предлагает безопасные альтернативы (нормы, мануалы, чек‑листы). Исследование safe‑completions .

Системная карта фиксирует и другие эффекты: падение «sycophancy» (угождательства), улучшения в честности (explicit «не могу сделать это здесь») и более предсказуемое поведение в условиях отсутствующих зависимостей/ресурсов. Для продакшена это снижает риск «уверенных заблуждений» и делает аудит решений (в т. ч. через мониторинг цепочек рассуждений) практичнее. Системная карта GPT‑5 .

Доступность и дорожная карта

  • ChatGPT: GPT‑5 — новая модель по умолчанию у всех залогиненных пользователей; переключатели на GPT‑5 Thinking/Pro — в платных планах. Развёртывание идёт сегодня (7 августа 2025) и далее по регионам.
  • Командные и корпоративные планы: ChatGPT Team уже с GPT‑5; Enterprise и Edu получают обновление в ближайшие дни (анонс указан на лендинге).
  • Голосовой режим: временно на GPT‑4o, обновление обещают позже.

Кому апгрейд даст максимум

  • Инженерам и но‑кодовым разработчикам интерфейсов: фронтенд-генерация «с чувством вкуса», более устойчивые цепочки инструментов, быстрые «минимальные рассуждения», когда нужно просто и быстро.
  • Аналитикам и авторам: лучше стиль, структура и работа с длинными источниками (исследования, отчёты).
  • Задачи с высоким риском фактических ошибок: поиск и синтез с меньшим числом галлюцинаций, плюс более честные «отказы» там, где среда не позволяет выполнить задачу.
  • Медицинский self‑advocacy: аккуратнее формулирует вопросы к врачу и даёт рамки, но помним: это не медконсультация.

Ограничения и здравый смысл

Это всё ещё языковая модель: она может ошибаться, особенно без инструментов и без явных ссылок. В некоторых категориях безопасности «основной» режим ещё дорабатывают (см. регрессии в таблицах системной карты), а Voice пока работает на 4o. Если вы строите продукт, включайте проверку фактов и наблюдение за агентными цепочками — в GPT‑5 для этого есть базовые «ограждения», но ответственность всё равно на вас.

Итог

GPT‑5 — это шаг не столько «про IQ», сколько про надёжность и пригодность к работе: умнее по метрикам, честнее в сложных ситуациях, дешевле и управляемее в API. Если вы уже пользовались 4o/o3, переход кажется естественным: меньше ручной настройки, больше результата по принципу «поставил задачу — получил результат». А если вы только присматриваетесь — сейчас как раз тот момент, когда ChatGPT снова стал заметно полезнее по умолчанию.

ChatGPT 5 GPT‑5 обзор что нового сравнение GPT‑4o o3 safe-completions GPT‑5 Thinking GPT‑5 Pro цена API контекст 400К SWE‑bench AIME 2025 HealthBench
Alt text
Обращаем внимание, что все материалы в этом блоге представляют личное мнение их авторов. Редакция SecurityLab.ru не несет ответственности за точность, полноту и достоверность опубликованных данных. Вся информация предоставлена «как есть» и может не соответствовать официальной позиции компании.

Смысл жизни продаётся. Кто наживается на вашей пустоте?

Коучи, священники, «энерготерапевты» — все они готовы помочь вам «найти себя»… за деньги. Мы разоблачаем индустрию, которая торгует иллюзией смысла и строит миллиардный бизнес на человеческой уязвимости.


Юрий Кочетов

Здесь я делюсь своими не самыми полезными, но крайне забавными мыслями о том, как устроен этот мир. Если вы устали от скучных советов и правильных решений, то вам точно сюда.