На китайском рынке искусственного интеллекта обострилась конкуренция. Крупные игроки, включая SenseTime и ByteDance, усиливают свои позиции за счёт новых функций и снижения цен.
Компания SenseTime, акции которой торгуются на Гонконгской бирже, объявила об обновлении своего чат-бота Sensechat , способного говорить на кантонском диалекте. Теперь он поддерживает аудио- и видео взаимодействие в реальном времени, а также может распознавать изображения и рассуждать на их основе. Эти возможности стали результатом внедрения мультимодальной архитектуры модели SenseNova V6, которая позволяет работать сразу с текстами, видео и звуками.
Практически одновременно с этим ByteDance, владеющая TikTok, представила обновлённую линейку своих языковых моделей Doubao 1.6 . В неё вошли три варианта — базовая модель с мультимодальным мышлением, версия для решения сложных задач и облегчённая модель для повседневного использования. Компания также существенно снизила цены: 0,8 юаня за миллион входных токенов и 8 юаней за миллион выходных. Это более чем на 60 процентов дешевле по сравнению с предыдущими версиями и конкурентом DeepSeek R1, что может спровоцировать ценовую войну на рынке.
Кроме того, ByteDance представила новый инструмент генерации видео под названием SeedDance Pro . По оценке аналитической компании Artificial Analysis, он уже входит в число ведущих моделей мира по качеству создания видео из текста и изображений.
Все эти анонсы прозвучали на фоне активных обновлений со стороны других китайских разработчиков, включая DeepSeek, Baidu и Alibaba. В конце мая DeepSeek обновила модель R1, заявив, что она догоняет по качеству продукты OpenAI и Google. А в апреле свои флагманские ИИ также обновили Alibaba и Baidu, усилив мультимодальные возможности и снизив стоимость использования, чтобы привлечь больше клиентов.