В Copilot появятся MAI-Voice-1 и MAI-1-preview.
Microsoft объявила о запуске собственных моделей искусственного интеллекта, которые компания разработала внутри своей команды и планирует внедрять в продукты. Этот шаг можно рассматривать как попытку снизить зависимость от OpenAI, несмотря на многомиллиардные инвестиции в партнёра. Первые сведения о том, что Microsoft работает над собственными базовыми моделями, появились ещё больше года назад.
В блоге Microsoft AI описаны две новые разработки. Первая — MAI-Voice-1, модель генерации речи, которая создаёт естественное, выразительное аудио для диалогов с одним или несколькими собеседниками. По замыслу компании, голос станет одним из ключевых способов взаимодействия пользователей с ИИ-сервисами, хотя эта идея пока не получила массового воплощения.
Вторая модель называется MAI-1-preview. Это крупная языковая модель, специально обученная для работы в Copilot — чат-боте Microsoft. Для её обучения использовалось около 15 тысяч графических процессоров Nvidia H100, а для запуска достаточно одного. Она значительно больше по масштабу, чем предыдущие эксперименты Microsoft с компактными моделями, вроде Phi-3, рассчитанными на локальное использование.
До настоящего времени Copilot в основном опирался на модели OpenAI. Microsoft вложила в этого партнёра огромные средства, и разрыв отношений вряд ли произойдёт, однако в последние месяцы между компаниями возникали трения из-за различий в приоритетах и целях. Поэтому для Microsoft стратегически важно развивать собственные решения.
Не исключено, что новые модели призваны закрыть сценарии, на которые OpenAI не делает упора. В отрасли заметен сдвиг в сторону более узкоспециализированных моделей, создаваемых под конкретные задачи, а не универсальных систем, которые должны уметь всё сразу. Об этом же говорил глава Microsoft AI Мустафа Сулейман в подкасте The Verge: его цель — строить такие модели, которые действительно работают для конечного пользователя.
Логично, что первыми площадками для внедрения станут сервисы Copilot, ориентированные именно на массовую аудиторию. В компании отмечают, что MAI-1-preview предназначена для выполнения инструкций и предоставления полезных ответов на повседневные вопросы.
MAI-Voice-1 уже используется в функциях Copilot Daily и Podcasts, а протестировать её возможности можно в интерфейсе Copilot Labs — там доступна настройка голоса и стиля произношения. MAI-1-preview пока проходит публичное тестирование на платформе LMArena и в ближайшие недели будет постепенно интегрироваться в отдельные сценарии Copilot.