DeepSeek vs ChatGPT: кто победил в битве ИИ

Китайская компания DeepSeek буквально за несколько дней превратилась из малоизвестного стартапа в главную тему обсуждений технологического сообщества. Ее чат-бот молниеносно взлетел на вершину чартов Apple App Store и Google Play, заставив аналитиков Уолл-стрит и технологических экспертов всерьез задуматься о будущем американского лидерства в сфере искусственного интеллекта.

От торговых алгоритмов до прорывов в ИИ

История DeepSeek начинается не в стенах технологического стартапа, а в мире квантовых хедж-фондов. Компания выросла из High-Flyer Capital Management — китайского количественного хедж-фонда, который использует алгоритмы искусственного интеллекта для принятия торговых решений.

Основатель фонда Лян Вэньфэн, энтузиаст искусственного интеллекта, начал свой путь еще студентом Чжэцзянского университета, где впервые попробовал себя в трейдинге. В 2015 году он стал соучредителем High-Flyer, а к 2019 году запустил полноценный хедж-фонд, сосредоточенный на разработке и внедрении ИИ-алгоритмов.

Переломный момент наступил в 2023 году, когда High-Flyer создал DeepSeek как отдельную исследовательскую лабораторию, посвященную изучению инструментов искусственного интеллекта вне финансового бизнеса. Вскоре лаборатория выделилась в самостоятельную компанию с тем же названием — DeepSeek.

Технические вызовы и инновационные решения

С самого начала DeepSeek строил собственные кластеры дата-центров для обучения моделей. Однако, как и другие китайские ИИ-компании, DeepSeek столкнулся с ограничениями американских экспортных запретов на оборудование. Для обучения одной из своих последних моделей компания была вынуждена использовать чипы Nvidia H800 — менее мощную версию H100, доступную американским компаниям.

Техническая команда DeepSeek отличается молодостью состава. Компания агрессивно рекрутирует докторов наук в области ИИ из ведущих китайских университетов. Интересно, что DeepSeek также нанимает специалистов без образования в области компьютерных наук — это помогает их технологиям лучше понимать широкий спектр предметных областей.

Эволюция моделей: от первых шагов до мирового признания

В ноябре 2023 года DeepSeek представил свой первый набор моделей: DeepSeek Coder, DeepSeek LLM и DeepSeek Chat. Однако настоящий прорыв произошел весной следующего года с выпуском семейства моделей DeepSeek-V2 нового поколения.

DeepSeek-V2: Переломный момент

DeepSeek-V2 представляет собой универсальную систему анализа текста и изображений, которая продемонстрировала впечатляющие результаты в различных ИИ-бенчмарках. Главным козырем модели стала ее экономическая эффективность — она оказалась значительно дешевле в эксплуатации по сравнению с аналогичными решениями того времени.

Успех DeepSeek-V2 заставил китайских конкурентов, включая ByteDance и Alibaba, срочно снижать цены на использование своих моделей, а некоторые сервисы и вовсе сделать бесплатными.

DeepSeek-V3: Новый уровень производительности

Запуск DeepSeek-V3 в декабре 2024 года только усилил репутацию компании. Согласно внутреннему тестированию DeepSeek, модель V3 превосходит как открыто доступные модели вроде Meta Llama, так и "закрытые" модели, доступные только через API, включая GPT-4o от OpenAI.

R1: Революция в "рассуждающих" моделях

Особое внимание заслуживает модель DeepSeek R1, выпущенная в январе 2025 года. Эта "рассуждающая" модель, по заявлениям DeepSeek, демонстрирует производительность на уровне модели o1 от OpenAI в ключевых бенчмарках.

Принцип работы рассуждающих моделей заключается в том, что они эффективно проверяют собственные факты, что помогает избежать многих ошибок, характерных для обычных моделей. Хотя такие модели работают медленнее — обычно на секунды или минуты дольше — они демонстрируют значительно большую надежность в областях физики, науки и математики.

Ограничения и политические аспекты

Несмотря на технические достижения, модели DeepSeek имеют существенные ограничения. Как китайские разработки в области ИИ, они подлежат проверке интернет-регулятором Китая для обеспечения соответствия "основным социалистическим ценностям". В чат-боте DeepSeek модель R1 отказывается отвечать на вопросы о площади Тяньаньмэнь или автономии Тайваня.

Рыночное влияние и бизнес-модель

К марту 2024 года DeepSeek превысил отметку в 16,5 миллионов посещений, заняв второе место по популярности, несмотря на 25%-ное снижение трафика по сравнению с февралем. Впрочем, эти цифры все еще бледнеют на фоне ChatGPT, который превысил 500 миллионов еженедельных активных пользователей.

Бизнес-модель DeepSeek остается загадкой. Компания устанавливает цены на свои продукты и услуги значительно ниже рыночных, а многие предлагает бесплатно. При этом DeepSeek не привлекает инвестиционные средства, несмотря на огромный интерес венчурных капиталистов.

Компания объясняет свою ценовую конкурентоспособность прорывами в области эффективности, хотя некоторые эксперты ставят под сомнение предоставленные цифры.

Реакция индустрии: от восхищения до запретов

Разработчики активно используют модели DeepSeek, которые хотя и не являются полностью открытыми в традиционном понимании, доступны под либеральными лицензиями, разрешающими коммерческое использование. По данным генерального директора Hugging Face Клема Деланга, разработчики создали более 500 "производных" моделей на базе R1, которые в совокупности скачали 2,5 миллиона раз.

Успех DeepSeek вызвал разнообразные реакции:

Положительные:

Microsoft включил DeepSeek в свой сервис Azure AI Foundry
Генеральный директор Nvidia Дженсен Хуанг отметил "превосходные инновации" DeepSeek

Настороженные:

Цена акций Nvidia упала на 18% в январе частично из-за успеха DeepSeek
Генеральный директор OpenAI Сэм Альтман был вынужден публично отреагировать на достижения конкурента

Враждебные:

OpenAI назвал DeepSeek "субсидируемым государством" и "контролируемым государством"
Южная Корея запретила использование DeepSeek
Штат Нью-Йорк запретил DeepSeek на правительственных устройствах
Microsoft запретил сотрудникам использовать DeepSeek из-за опасений по поводу безопасности данных

Глобальные последствия и будущее

Феномен DeepSeek заставил индустрию пересмотреть представления о необходимых ресурсах для создания конкурентоспособных AI-моделей. Если заявления компании о вычислительной эффективности соответствуют действительности, это может кардинально изменить экономику разработки искусственного интеллекта.

Марк Цукерберг, отвечая на вопросы о влиянии DeepSeek на ИИ-расходы Meta, подчеркнул, что инвестиции в ИИ-инфраструктуру продолжат оставаться "стратегическим преимуществом" компании.

Перспективы развития

Будущее DeepSeek остается неопределенным. Улучшенные модели, безусловно, будут выпущены, но американское правительство демонстрирует растущую настороженность по отношению к тому, что оно воспринимает как вредное иностранное влияние.

В марте 2025 года The Wall Street Journal сообщил, что США, вероятно, запретят DeepSeek на правительственных устройствах. Вице-председатель и президент Microsoft Брэд Смит заявил в Сенате, что сотрудникам Microsoft не разрешается использовать DeepSeek из-за проблем безопасности данных и пропаганды.

Заключение

История DeepSeek демонстрирует, как инновационные подходы к разработке ИИ могут быстро изменить расстановку сил на глобальном рынке. Независимо от политических и экономических споров вокруг компании, ее технические достижения уже заставили индустрию пересмотреть устоявшиеся представления о разработке и внедрении искусственного интеллекта.

Китайская лаборатория доказала, что революционные прорывы в ИИ могут происходить не только в Кремниевой долине, но и в любой точке мира, где есть талантливые исследователи и инновационные подходы к решению технологических задач.

DeepSeek vs ChatGPT: кто победил в битве ИИ

От торговых алгоритмов до прорывов в ИИ

Технические вызовы и инновационные решения

Эволюция моделей: от первых шагов до мирового признания

DeepSeek-V2: Переломный момент

DeepSeek-V3: Новый уровень производительности

R1: Революция в "рассуждающих" моделях

Ограничения и политические аспекты

Рыночное влияние и бизнес-модель

Реакция индустрии: от восхищения до запретов

Глобальные последствия и будущее

Перспективы развития

Заключение

Комнатный Блогер

Объясняю новую цифровую реальность

Думаешь, тебя это не коснётся? Каждый может стать целью. Узнай, как защититься.

DeepSeek vs ChatGPT: кто победил в битве ИИ

От торговых алгоритмов до прорывов в ИИ

Технические вызовы и инновационные решения

Эволюция моделей: от первых шагов до мирового признания

DeepSeek-V2: Переломный момент

DeepSeek-V3: Новый уровень производительности

R1: Революция в "рассуждающих" моделях

Ограничения и политические аспекты

Рыночное влияние и бизнес-модель

Реакция индустрии: от восхищения до запретов

Глобальные последствия и будущее

Перспективы развития

Заключение

Комнатный Блогер

Объясняю новую цифровую реальность

Подпишитесь на email рассылку