Похоже, времена американской монополии на ИИ окончательно прошли.

Китайская компания Alibaba Cloud представила новую языковую модель Qwen3-Max-Thinking, разработанную командой Qwen. По заявлениям разработчиков, модель демонстрирует выдающиеся результаты в области машинного рассуждения и уже обогнала западные аналоги, включая Gemini 3 Pro и GPT-5.2, по ряду ключевых показателей. Выход Qwen3-Max-Thinking укрепляет позиции китайских технологий на глобальном рынке ИИ, где ранее доминировали компании из США.
Модель была протестирована на сложных задачах, включая экзамен HLE, включающий 3000 вопросов уровня аспирантуры, которые нельзя решить с помощью простого поиска в интернете. В этом тесте Qwen3-Max-Thinking с интегрированными инструментами веб-поиска набрала 49,8 балла — выше, чем Gemini 3 Pro и GPT-5.2, которые показали 45,8 и 45,5 балла соответственно. Разработчики считают, что архитектура модели особенно хорошо справляется с многоступенчатыми задачами, в которых требуется привлечение внешней информации.
Одним из главных технических отличий модели стало использование технологии «масштабирования в момент выполнения», позволяющей перераспределять вычислительные ресурсы в процессе генерации ответа. Вместо линейного подхода Qwen3-Max-Thinking анализирует промежуточные шаги, распознаёт неэффективные направления рассуждений и переориентирует вычисления на участки, где требуется уточнение. Такой подход позволяет повысить точность без резкого роста затрат.
Модель также оснащена системой адаптивного выбора инструментов, которая позволяет автоматически переключаться между режимами, включая веб-поиск, интерпретатор кода и систему памяти. Это делает возможной работу с фактами в реальном времени, выполнение вычислений и аналитическую обработку в рамках одного запроса. По мнению команды Qwen, такая модульность снижает уровень «галлюцинаций» и повышает надёжность ответов, поскольку модель может опираться на актуальные данные, а не только на обучение.
В области программирования Qwen3-Max-Thinking также продемонстрировала уверенное лидерство. В тесте Arena-Hard v2 она набрала 90,2 балла, значительно опередив ближайших конкурентов, включая модель Claude-Opus-4.5 с её результатом в 76,7 балла.
При этом стоимость использования модели остаётся относительно доступной. За 1 млн токенов ввода пользователи платят $1.20, за вывод — $6.00. Для сравнения, аналогичный объём работы с GPT-5.2 стоит $15.75. Qwen3-Max-Thinking предлагает также инструментальные функции, такие как веб-поиск и интерпретатор кода, за отдельную плату — $10 за 1000 вызовов, хотя на момент запуска ряд опций доступен бесплатно.
Модель поддерживает форматы взаимодействия, совместимые с API OpenAI и Anthropic, что упрощает интеграцию в существующие инфраструктуры. Разработчики отмечают, что смена провайдера возможна путём простой замены адреса и названия модели в настройках.
Выход Qwen3-Max-Thinking поднимает планку для конкурентов и делает ставку не на очередного «умного бота», а на полноценного интеллектуального агента, способного решать сложные задачи с привлечением внешних ресурсов. Благодаря сочетанию продуманной архитектуры, гибкого взаимодействия с инструментами и агрессивной ценовой стратегии модель может заинтересовать компании, ищущие баланс между возможностями и затратами.