Коты правят интернетом, а RoboCat правит роботами

Коты правят интернетом, а RoboCat правит роботами

Новая разработка DeepMind уже сейчас обладает массой полезных навыков, но также способна самостоятельно совершенствоваться.

image

Исследователи DeepMind научили роботов с поражающей скоростью осваивать новые навыки. Об этом представители компании сообщили в статье, опубликованной на arXiv.

Они разработали ИИ под названием RoboCat, который использует ту же технологию, что и большие языковые модели (LLM) — архитектуру трансформера. Эта технология позволяет ИИ обрабатывать огромные объёмы данных и использовать свои знания для выполнения новых задач.

RoboCat был обучен на десятках тысяч демонстраций четырёх разных роботизированных рук, выполняющих сотни разных действий, таких как сортировка цветных кирпичей или выбор правильного фрукта из корзины. Эти демонстрации были произведены как людьми, управляющими роботами на расстоянии, так и специальными ИИ, контролирующими виртуальных роботов.

Благодаря такому обучению RoboCat стал универсалом, способным справляться с широким спектром робототехнических задач с использованием различных конфигураций оборудования. Кроме того, теперь он может осваивать новые задачи, просмотрев от 100 до 1000 демонстраций от человеческого робота. Это гораздо меньше, чем обычно требуется для обучения, что свидетельствует о том, что модель опирается на более общие навыки управления роботами, а не начинает с нуля.

Самое интересное, что RoboCat может самоулучшаться. Исследователи создали несколько модифицированных моделей, настроенных на конкретные задачи, и затем использовали эти модели для генерации примерно 10 000 новых демонстраций задачи. Эти демонстрации затем добавлялись к существующему набору данных и использовались для обучения новой версии RoboCat с повышенной производительностью.

Когда первой версии RoboCat было показано 500 демонстраций новой для робота задачи, он мог успешно выполнить её в 36 процентах случаев. Но после нескольких раундов самоулучшения и самообучения этот показатель очень быстро удвоился, составив уже 74 процента.

В решении некоторых проблем модель всё ещё демонстрирует успех ниже 50 процентов, а по одной конкретной задаче и вовсе 13 процентов. Однако способность RoboCat овладевать многими разными навыками и быстро всё подхватывать говорит о том, что адаптивный интеллект для роботов уже не за горами.

Если вам нравится играть в опасную игру, присоединитесь к нам - мы научим вас правилам!

Подписаться