Глаза робота стали умнее.
Boston Dynamics показала , как человекоподобный робот Atlas учится «видеть» мир — не просто замечать объекты, а интерпретировать их форму, назначение и расположение в пространстве. Это ключ к тому, чтобы робот мог работать в реальной производственной среде: собирать автодетали, двигаться между стеллажами, корректировать ошибки и адаптироваться к неожиданным изменениям.
Система восприятия Atlas начинается с 2D-анализа: камера фиксирует объекты, определяет границы, ключевые точки и опасности на полу. Особое внимание уделяется стеллажам — это громоздкие конструкции, где лежат автомобильные запчасти. Atlas не только различает их форму и тип, но и точно распознаёт внутренние ячейки, куда нужно поместить деталь.
Следующий уровень — 3D-понимание. Робот рассчитывает своё положение относительно каждого объекта и оценивает, как взять и куда перенести предмет. При этом система должна учитывать множество факторов: углы обзора, недоступные точки, похожие объекты и изменяющуюся обстановку. Например, если кто-то переместит стеллаж за спиной робота, Atlas скорректирует поведение и пересчитает маршрут.
Для отслеживания положения объектов используется система SuperTracker. Она объединяет данные с камер, датчиков движения и, при необходимости, сенсоров усилий. Даже если предмет выходит из поля зрения, Atlas продолжает отслеживать его положение по данным о движении своих рук и корпусу. Если предмет соскользнул, система это заметит.
Камеры и кинематика работают асинхронно: визуальные данные приходят реже, но дополняются высокочастотными измерениями положения суставов. Специальный алгоритм сглаживания выстраивает наиболее правдоподобную 6D-траекторию движения объекта в пространстве.
Отдельное внимание — калибровке. Чтобы Atlas мог точно схватить и вставить деталь, система зрения и система управления движениями должны быть идеально синхронизированы. Это достигается сложной процедурой настройки, которая учитывает даже деформации конструкции из-за температуры и ударов.
Впереди у команды Boston Dynamics задача объединить восприятие и действия в единую модель. Следующий шаг — не просто видеть и действовать по отдельности, а реагировать на события «атлетически»: быстро, точно и с учётом контекста.