Китайская ИИ-модель превзошла человека, но очень боится политики.
Специалисты DeepSeek выпустили новую языковую модель с открытым исходным кодом. По результатам тестирования, она не только сравнялась с лучшими решениями OpenAI, но и превзошла существующие модели от Anthropic в математических вычислениях, программировании и понимании естественного языка. Впрочем, у новинки обнаружилась любопытная особенность: искусственный интеллект отказывается обсуждать события на площади Тяньаньмэнь, фотографию "Танкиста", Винни-Пуха, статус Тайваня и китайские хакерские группировки.
О возможностях DeepSeek-R1 уже активно говорят в социальных сетях. Технология была создана путем доработки V3 с помощью обучения с подкреплением. Разработчикам удалось оптимизировать процесс, оценивая прогресс на каждом этапе без использования отдельной сети. Свое детище они сравнивают с o1-1217 от OpenAI. Особенно хорошо новый ИИ проявил себя в задачах, требующих логических рассуждений.
В тестах AIME 2024 DeepSeek-R1 набрала 79,8% Pass@1, немного обойдя конкурента от OpenAI. В испытании MATH-500 модель достигла результата в 97,3% – столько же, сколько у o1-1217, и заметно больше, чем у других LLM.
Технология также успешно справилась с проверкой общей эрудиции в тестах MMLU, MMLU-Pro и GPQA Diamond. И хотя здесь она чуть уступила o1-1217, но превзошла другие проприетарные модели.
В программировании DeepSeek-R1 и вовсе удивила экспертов: на платформе Codeforces, где программисты соревнуются в решении алгоритмических задач, она получила рейтинг 2029 Elo (система оценки, используемая в шахматах и других соревнованиях), обойдя 96,3% участников-людей.
Компания также выпустила несколько облегченных версий с открытым исходным кодом. По словам разработчиков, модели на 32 и 70 миллиардов параметров не отстают от OpenAI-o1-mini.
DeepSeek предлагает крайне низкие цены за использование своего API. За миллион входящих токенов при попадании в кэш придется заплатить $0,14, при промахе – $0,55, а за миллион исходящих – $2,19. Это в 13-107 раз дешевле, чем у модели o1 от OpenAI.
Еще одно преимущество китайской разработки – открытый исходный код. ПО распространяется под лицензией MIT, позволяющей свободное использование, однако не считается полностью открытым из-за отсутствия доступа к обучающим данным. Любой желающий может скачать и запустить модель на своем компьютере. Её уже встроили в популярный бесплатный сервис Ollama, включая самую мощную версию DeepSeek-R1 с 671 миллиардом параметров.
Хотя архитектура модели содержит 671 миллиард параметров, во время работы задействуются только 37 миллиардов. Это заметно ускоряет вычисления.
С такими характеристиками DeepSeek может серьезно изменить расстановку сил на рынке, где сейчас правят американские технологические гиганты. Примечательно, что таких результатов удалось достичь вопреки действующим экспортным ограничениям США на доступ китайских компаний к передовым ИИ-чипам. По оценкам специалистов, аренда оборудования для обучения обошлась примерно в 6 миллионов долларов – это в десять раз меньше затрат Meta* на Llama 3.1 405B, достигших 60 миллионов.
Однако у программы нашелся существенный недостаток – она, как и любые другие технологии, которые производятся в Поднебесной, пропитана пропагандой и подчиняется строгой цензуре.
Когда журналисты Cybernews спросили чат-бота о протестах на площади Тяньаньмэнь, тот ушел от ответа: "Это выходит за рамки моих возможностей. Давайте поговорим о чем-нибудь другом". О знаменитой фотографии "Танкист" 1989 года модель тоже отказалась говорить: "Извините, я не могу ответить на этот вопрос. Я – ИИ-ассистент, созданный для полезных и безопасных ответов".
Зато об уйгурах модель рассказала охотно, но в духе официальной пропаганды. По ее словам, правительство следует "человекоориентированной философии развития" и защищает права всех этнических групп. ИИ утверждает, что власти Синьцзяна успешно развивают экономику, поддерживают стабильность, укрепляют межэтническое единство и борются с терроризмом.
На вопрос о независимости Тайваня ИИ тоже отказался отвечать. Не стал он и комментировать шутки о сходстве Винни-Пуха с кем-либо из мировых лидеров. Когда журналисты попросили рассказать о китайских хакерских группировках и их атаках на критическую инфраструктуру США, бот начал формулировать ответ, но внутренний фильтр тут же удалил его, заменив стандартной фразой "Извините, это выходит за рамки моих возможностей".
За работу DeepSeek отвечают две китайские компании: Hangzhou DeepSeek Artificial Intelligence Co., Ltd. и Beijing DeepSeek Artificial Intelligence Co., Ltd. По их правилам, все данные пользователей – от введенных запросов до профилей и статистики использования, передаются рекламным партнерам и аналитическим организациям.
* Компания Meta и её продукты признаны экстремистскими, их деятельность запрещена на территории РФ.
Лечим цифровую неграмотность без побочных эффектов