Программисты против ИИ: новая версия Claude 4 пишет код быстрее и чище

leer en español

Программисты против ИИ: новая версия Claude 4 пишет код быстрее и чище

Claude 4 обходит программистов по скорости и качеству кода.

image

Anthropic продолжает продвигать свою линейку языковых моделей Claude — и последние обновления, действительно впечатляют. По данным компании Lovable, создающей платформу для разработки приложений на основе промптов, новая модель Claude 4 значительно улучшила качество и скорость генерации кода . После внедрения Claude 4 количество синтаксических ошибок в среде разработки Lovable снизилось на 25% , а общая производительность выросла на 40%.

Lovable активно использует модели Claude в своей системе «Vibe Coding» — подходе к созданию веб-приложений на базе искусственного интеллекта, где ключевым элементом является не голый код, а грамотное использование ИИ-промптов. Компания утверждает, что обновление принесло улучшения как в новых проектах, так и при редактировании уже существующих. Основатель Lovable Антон Осика также подтвердил , что Claude 4 фактически устранил большинство ошибок, связанных с синтаксисом LLM.

На этом фоне Anthropic объявила о запуске двух новых версий модели — Claude Sonnet 4 и Claude Opus 4. Первая доступна бесплатно, вторая требует платной подписки и демонстрирует более высокий уровень при генерации кода. Согласно официальному блогу Anthropic, модель Opus 4 показала результат 72,5% в тесте SWE-bench — бенчмарке, ориентированном на задачи программной инженерии.

Среди прочего, Opus 4 проявила устойчивую производительность в ходе задач, требующих многотысячных шагов и долгосрочной концентрации. В одном из тестов модель без перебоев писала код на протяжении семи часов подряд — редкое достижение даже среди современных LLM.

Несмотря на рост популярности моделей от Google, особенно после релиза Gemini 1.5 Pro с контекстным окном на 1 миллион токенов, Claude сохраняет статус одного из лучших решений именно для задач программирования . У Claude 4, в отличие от Gemini, окно ограничено 200 тысячами токенов, но даже это не мешает ему демонстрировать более точные результаты в ряде проектов — особенно в случаях, где не требуется работа с большим контекстом.

Выбор подходящей модели зависит от конкретного проекта и типа задач. Некоторые разработчики предпочитают комбинировать возможности разных LLM: использовать, например, ChatGPT o3 или Gemini для планирования архитектуры, а затем делегировать Claude 4 написание самого кода.

Пока индустрия активно тестирует новые инструменты, такие гибридные подходы становятся всё более распространёнными — и показывают, что даже в мире ИИ хорошая инженерия начинается с грамотного выбора инструмента.

Красная или синяя таблетка?

В Матрице безопасности выбор очевиден.