DeepSeek vs ChatGPT: кто победил в битве ИИ

DeepSeek vs ChatGPT: кто победил в битве ИИ

Китайская компания DeepSeek буквально за несколько дней превратилась из малоизвестного стартапа в главную тему обсуждений технологического сообщества. Ее чат-бот молниеносно взлетел на вершину чартов Apple App Store и Google Play, заставив аналитиков Уолл-стрит и технологических экспертов всерьез задуматься о будущем американского лидерства в сфере искусственного интеллекта.

От торговых алгоритмов до прорывов в ИИ

История DeepSeek начинается не в стенах технологического стартапа, а в мире квантовых хедж-фондов. Компания выросла из High-Flyer Capital Management — китайского количественного хедж-фонда, который использует алгоритмы искусственного интеллекта для принятия торговых решений.

Основатель фонда Лян Вэньфэн, энтузиаст искусственного интеллекта, начал свой путь еще студентом Чжэцзянского университета, где впервые попробовал себя в трейдинге. В 2015 году он стал соучредителем High-Flyer, а к 2019 году запустил полноценный хедж-фонд, сосредоточенный на разработке и внедрении ИИ-алгоритмов.

Переломный момент наступил в 2023 году, когда High-Flyer создал DeepSeek как отдельную исследовательскую лабораторию, посвященную изучению инструментов искусственного интеллекта вне финансового бизнеса. Вскоре лаборатория выделилась в самостоятельную компанию с тем же названием — DeepSeek.

Технические вызовы и инновационные решения

С самого начала DeepSeek строил собственные кластеры дата-центров для обучения моделей. Однако, как и другие китайские ИИ-компании, DeepSeek столкнулся с ограничениями американских экспортных запретов на оборудование. Для обучения одной из своих последних моделей компания была вынуждена использовать чипы Nvidia H800 — менее мощную версию H100, доступную американским компаниям.

Техническая команда DeepSeek отличается молодостью состава. Компания агрессивно рекрутирует докторов наук в области ИИ из ведущих китайских университетов. Интересно, что DeepSeek также нанимает специалистов без образования в области компьютерных наук — это помогает их технологиям лучше понимать широкий спектр предметных областей.

Эволюция моделей: от первых шагов до мирового признания

В ноябре 2023 года DeepSeek представил свой первый набор моделей: DeepSeek Coder, DeepSeek LLM и DeepSeek Chat. Однако настоящий прорыв произошел весной следующего года с выпуском семейства моделей DeepSeek-V2 нового поколения.

DeepSeek-V2: Переломный момент

DeepSeek-V2 представляет собой универсальную систему анализа текста и изображений, которая продемонстрировала впечатляющие результаты в различных ИИ-бенчмарках. Главным козырем модели стала ее экономическая эффективность — она оказалась значительно дешевле в эксплуатации по сравнению с аналогичными решениями того времени.

Успех DeepSeek-V2 заставил китайских конкурентов, включая ByteDance и Alibaba, срочно снижать цены на использование своих моделей, а некоторые сервисы и вовсе сделать бесплатными.

DeepSeek-V3: Новый уровень производительности

Запуск DeepSeek-V3 в декабре 2024 года только усилил репутацию компании. Согласно внутреннему тестированию DeepSeek, модель V3 превосходит как открыто доступные модели вроде Meta Llama, так и "закрытые" модели, доступные только через API, включая GPT-4o от OpenAI.

R1: Революция в "рассуждающих" моделях

Особое внимание заслуживает модель DeepSeek R1, выпущенная в январе 2025 года. Эта "рассуждающая" модель, по заявлениям DeepSeek, демонстрирует производительность на уровне модели o1 от OpenAI в ключевых бенчмарках.

Принцип работы рассуждающих моделей заключается в том, что они эффективно проверяют собственные факты, что помогает избежать многих ошибок, характерных для обычных моделей. Хотя такие модели работают медленнее — обычно на секунды или минуты дольше — они демонстрируют значительно большую надежность в областях физики, науки и математики.

Ограничения и политические аспекты

Несмотря на технические достижения, модели DeepSeek имеют существенные ограничения. Как китайские разработки в области ИИ, они подлежат проверке интернет-регулятором Китая для обеспечения соответствия "основным социалистическим ценностям". В чат-боте DeepSeek модель R1 отказывается отвечать на вопросы о площади Тяньаньмэнь или автономии Тайваня.

Рыночное влияние и бизнес-модель

К марту 2024 года DeepSeek превысил отметку в 16,5 миллионов посещений, заняв второе место по популярности, несмотря на 25%-ное снижение трафика по сравнению с февралем. Впрочем, эти цифры все еще бледнеют на фоне ChatGPT, который превысил 500 миллионов еженедельных активных пользователей.

Бизнес-модель DeepSeek остается загадкой. Компания устанавливает цены на свои продукты и услуги значительно ниже рыночных, а многие предлагает бесплатно. При этом DeepSeek не привлекает инвестиционные средства, несмотря на огромный интерес венчурных капиталистов.

Компания объясняет свою ценовую конкурентоспособность прорывами в области эффективности, хотя некоторые эксперты ставят под сомнение предоставленные цифры.

Реакция индустрии: от восхищения до запретов

Разработчики активно используют модели DeepSeek, которые хотя и не являются полностью открытыми в традиционном понимании, доступны под либеральными лицензиями, разрешающими коммерческое использование. По данным генерального директора Hugging Face Клема Деланга, разработчики создали более 500 "производных" моделей на базе R1, которые в совокупности скачали 2,5 миллиона раз.

Успех DeepSeek вызвал разнообразные реакции:

Положительные:

  • Microsoft включил DeepSeek в свой сервис Azure AI Foundry
  • Генеральный директор Nvidia Дженсен Хуанг отметил "превосходные инновации" DeepSeek

Настороженные:

  • Цена акций Nvidia упала на 18% в январе частично из-за успеха DeepSeek
  • Генеральный директор OpenAI Сэм Альтман был вынужден публично отреагировать на достижения конкурента

Враждебные:

  • OpenAI назвал DeepSeek "субсидируемым государством" и "контролируемым государством"
  • Южная Корея запретила использование DeepSeek
  • Штат Нью-Йорк запретил DeepSeek на правительственных устройствах
  • Microsoft запретил сотрудникам использовать DeepSeek из-за опасений по поводу безопасности данных

Глобальные последствия и будущее

Феномен DeepSeek заставил индустрию пересмотреть представления о необходимых ресурсах для создания конкурентоспособных AI-моделей. Если заявления компании о вычислительной эффективности соответствуют действительности, это может кардинально изменить экономику разработки искусственного интеллекта.

Марк Цукерберг, отвечая на вопросы о влиянии DeepSeek на ИИ-расходы Meta, подчеркнул, что инвестиции в ИИ-инфраструктуру продолжат оставаться "стратегическим преимуществом" компании.

Перспективы развития

Будущее DeepSeek остается неопределенным. Улучшенные модели, безусловно, будут выпущены, но американское правительство демонстрирует растущую настороженность по отношению к тому, что оно воспринимает как вредное иностранное влияние.

В марте 2025 года The Wall Street Journal сообщил, что США, вероятно, запретят DeepSeek на правительственных устройствах. Вице-председатель и президент Microsoft Брэд Смит заявил в Сенате, что сотрудникам Microsoft не разрешается использовать DeepSeek из-за проблем безопасности данных и пропаганды.

Заключение

История DeepSeek демонстрирует, как инновационные подходы к разработке ИИ могут быстро изменить расстановку сил на глобальном рынке. Независимо от политических и экономических споров вокруг компании, ее технические достижения уже заставили индустрию пересмотреть устоявшиеся представления о разработке и внедрении искусственного интеллекта.

Китайская лаборатория доказала, что революционные прорывы в ИИ могут происходить не только в Кремниевой долине, но и в любой точке мира, где есть талантливые исследователи и инновационные подходы к решению технологических задач.

DeepSeek ChatGPT Китай США ИИ
Alt text
Обращаем внимание, что все материалы в этом блоге представляют личное мнение их авторов. Редакция SecurityLab.ru не несет ответственности за точность, полноту и достоверность опубликованных данных. Вся информация предоставлена «как есть» и может не соответствовать официальной позиции компании.
310K
долларов
до 18 лет
Антипов жжет
Ребёнок как убыточный
актив. Считаем честно.
Почему рожают меньше те, кто умеет считать на десять лет вперёд.

Комнатный Блогер

Объясняю новую цифровую реальность

FREE
100%
Кибербезопасность · Обучение
УЧИСЬ!
ИЛИ
ВЗЛОМАЮТ
Лучшие ИБ-мероприятия
и вебинары — в одном месте
ПОДПИШИСЬ
T.ME/SECWEBINARS