Скажи роботу словами — Microsoft создала ИИ, который слышит команды и чувствует касания

Скажи роботу словами — Microsoft создала ИИ, который слышит команды и чувствует касания

Rho-alpha — это первая попытка ИИ выйти в офлайн, чтобы трогать, ронять и ощущать наш мир.

image

Microsoft представила новую ИИ-модель для робототехники под названием Rho-alpha. Её главная задача — научить роботов нормально работать вне лабораторий, заводов и заранее подготовленных пространств, то есть в реальной среде, где всё меняется, ломается, смещается и никогда не выглядит одинаково.

Систему разработала команда Microsoft Research. Это первая модель компании, созданная специально для управления роботами и основанная на архитектуре семейства Phi, которое объединяет работу с изображениями, языком и логикой. Внутри Microsoft проект описывают как шаг в сторону так называемого «физического ИИ» — подхода, при котором алгоритмы перестают быть чисто цифровыми и начинают напрямую взаимодействовать с окружающим миром.

В отличие от классических промышленных машин, Rho-alpha не работает по жёстким сценариям. Она умеет превращать обычные команды на человеческом языке в реальные движения. Гуманоиду можно не задавать пошаговый алгоритм, а объяснить задачу словами, после чего система сама переводит их в набор управляющих сигналов. Особенно это важно для сложных действий, где задействованы обе руки, например при работе с предметами нестандартной формы или в тесных пространствах.

Сейчас модель тестируют на платформах с 2 манипуляторами и на гуманоидных роботах. Задача разработчиков — сделать универсальный «мозг», который можно подключать к разным типам машин без полной переработки логики управления.

Одно из главных отличий Rho-alpha — использование тактильной информации. Робот ориентируется не только на изображение с камер, но и на ощущения от прикосновения. Это позволяет корректировать движения по ходу действия, а не просто следовать визуальной картинке. В Microsoft уже заявили, что в следующих версиях планируют добавить чувствительность к усилиям, сопротивлению и другим физическим параметрам, чтобы движения становились точнее и безопаснее.

Система изначально построена как адаптивная. Она не просто повторяет выученные действия, а может менять поведение в процессе работы. Если андроид ошибается, человек может вмешаться и скорректировать его действия с помощью простых инструментов управления, например 3D-контроллеров. После этого модель учитывает эту коррекцию и использует её как обучающий сигнал.

Microsoft также работает над тем, чтобы обучение не прекращалось после внедрения робота в реальную среду. Идея в том, чтобы системы постепенно подстраивались под конкретных людей, привычки и условия работы. Такие машины будут не только полезнее, но и проще в совместной работе с человеком.

На первом этапе Rho-alpha будет доступна через исследовательскую программу раннего доступа. Позже модель планируют открыть для более широкого использования через платформу Foundry.

Отдельная проблема, которую пытается решить проект, — нехватка данных для обучения роботов. Сбор информации через прямое управление роботами вручную плохо масштабируется и быстро становится слишком дорогим.

Поэтому важную роль играет моделирование. Вместо постоянной работы с физическими устройствами создаются виртуальные среды, в которых роботы тренируются на симуляциях. Это позволяет генерировать большие массивы обучающих данных без участия операторов. Такие виртуальные сценарии дополняются реальными демонстрациями и большими наборами визуальных данных, где система учится связывать язык, изображение и движение в одну логику.

Значительная часть этих данных создаётся с помощью алгоритмов обучения с подкреплением в симуляторах, работающих на инфраструктуре Azure. После этого виртуальные траектории объединяются с информацией, собранной с реальных андроидов и из открытых источников.

По сути, Microsoft пытается уйти от модели, в которой робот обучается только на «живых» данных, к смешанной системе, где симуляции, реальный опыт и обратная связь от человека работают вместе. Это позволяет быстрее обучать сложным действиям и не зависеть от редких физических экспериментов.

Rho-alpha вписывается в более широкую идею: дать компаниям инструменты, с помощью которых они смогут сами настраивать обучение ИИ под свои задачи и свои машины, а не подстраиваться под готовые универсальные модели.

По мере того как роботы всё чаще выходят из цехов в обычную среду (дома, больницы, офисы, склады), именно способность подстраиваться под реальность становится решающей. Rho-alpha — попытка сделать шаг в сторону таких машин: не идеально запрограммированных, а умеющих учиться, ошибаться, исправляться и работать в мире, который невозможно заранее описать инструкциями.