Роботы больше не боятся упавшей гайки: ИИ-оракул учит станки предвидеть будущее на миллисекунды вперед

Роботы больше не боятся упавшей гайки: ИИ-оракул учит станки предвидеть будущее на миллисекунды вперед

FutureVision: показываете машине миллион случайных видео — и навсегда забываете про сбои на производстве.

image

Стартап Rhoda AI впервые вышел из режима секретной разработки и сразу показал, на что способен. Компания представила систему FutureVision для управления роботами и объявила о привлечении 450 млн долларов в раунде Series A. Идея простая: научить машину работать не только в стерильных лабораторных условиях, но и на обычном производстве, где детали лежат неровно, материалы меняются от партии к партии, а сам процесс постоянно выбивается из идеального сценария.

FutureVision строится вокруг довольно понятного принципа. Вместо того чтобы заставлять робота раз за разом идти по заранее заданной траектории, система пытается предсказать, что произойдет в следующую секунду, и уже под это выбирает действие. Модель постоянно смотрит на обстановку, строит видеопрогноз ближайшего будущего, от него отталкивается при управлении машиной и через несколько сотен миллисекунд повторяет весь цикл заново.

Для промышленной робототехники такой подход особенно важен. Обычные заводские роботы лучше всего работают там, где все жестко задано заранее: траектории известны, объекты лежат на своих местах, порядок операций не меняется. В такой среде машина действительно действует быстро и точно. Но стоит появиться лишнему предмету, сместиться раскладке, измениться ходу работы или начаться нестандартному циклу, и робот начинает ошибаться. Линию приходится останавливать и передавать работу человеку.

Более современные системы тоже не всегда решают проблему. Модели, которые связывают изображение, текст и действие, хорошо смотрятся на демонстрациях, но хуже переносят изменчивую обстановку. Иногда хватает небольшого сдвига условий, чтобы машина начала сбоить. Проблема не только в том, что робот может неправильно распознать объект. Главная трудность в другом: системе тяжело быстро перестроиться, когда реальная картина расходится с тем, чему ее учили.

Rhoda AI предлагает учить ИИ иначе. Вместо того чтобы почти целиком строить обучение на демонстрациях с реальными роботами, компания сначала прогоняет модель через сотни миллионов видеороликов из интернета. По замыслу разработчиков, это помогает системе заранее уловить базовые закономерности физического мира: как движутся предметы, как ведут себя материалы и как одно действие меняет обстановку в следующем кадре.

Затем алгоритм доучивают уже на данных от настоящих роботов. Таких данных нужно заметно меньше. Для настройки используют телеуправление: человек дистанционно ведет машину и показывает, как выполнять задачу, а система связывает увиденное с конкретными движениями.

В этом и состоит главное отличие от систем разомкнутого типа. В классической схеме робот получает план и выполняет его без постоянной сверки с тем, что происходит вокруг. У Rhoda AI цикл другой: наблюдение, прогноз, действие, новая проверка. Разработчики считают, что именно так можно сохранить точность там, где казусы неизбежы.

Есть у такого подхода и еще один практический плюс: объем данных. Компания утверждает, что для новой задачи часто хватает примерно 10 часов телеуправляемых демонстраций. Для робототехнических проектов, где сбор данных обычно стоит дорого и занимает много времени, это серьезный аргумент. Чем меньше сил уходит на обучение новой операции, тем проще перенести систему на другое производство или назначит другой функционал.

Rhoda AI утверждает, что FutureVision уже проверяли в реальных производственных условиях. В одном из испытаний на загруженном производстве система выполнила цикл обработки компонентов меньше чем за 2 минуты без участия человека. По данным компании, результат оказался выше целевых показателей заказчика.

Привлеченные 450 млн долларов компания собирается направить на исследования, инженерную работу, новые промышленные пилоты и расширение команды. Параллельно Rhoda AI хочет развивать FutureVision как базовую платформу, которую можно будет лицензировать партнерам, создающим робототехническое оборудование и программные системы.