Для тренировки алгоритмов больше не нужны огромные массивы цифровых данных.
Команда Google DeepMind представила новаторскую модель ИИ, которая способна обучаться через социальное взаимодействие. Результаты своей работы ученые опубликовали в журнале Nature Communications .
Сейчас большинство систем ИИ, таких как ChatGPT, получают знания через анализ крупных массивов данных из интернета и других источников. Однако эксперты отмечают, что эффективность такого подхода не так уж и высока с точки зрения скорости и качества обучения.
Поиски альтернативных методов для тренировки алгоритмов ведутся уже давно. Главная цель разработчиков — «научить» ИИ осваивать новое подобно людям. В отличие от машин, человек способен перенимать навыки, наблюдая лишь за небольшим количеством примеров и без необходимости обрабатывать терабайты данных.
Ученые из DeepMind решили воссоздать этот паттерн в рамках своего эксперимента.
Они разработали виртуальный мир GoalCycle3D, включающий неровную местность с разнообразными препятствиями и цветными сферами. В этот мир были помещены программные агенты ИИ, которые должны были преодолевать препятствия и проходить сквозь сферы к целевой точке.
Первоначально агенты не получали никаких знаний о правилах виртуальной вселенной и должны были обучаться методом подкрепления — за успешные действия им начислялись вознаграждения. Также они могли многократно повторять задачи в разных, но схожих условиях. Таким образом, к концу каждого испытания агенты успевали выработать оптимальную стратегию.
Затем ученые усложнили задачу. В симуляцию были добавлены так называемые экспертные агенты, уже знающие кратчайший путь к цели.
Эксперимент показал, что обычные агенты гораздо быстрее обучались, подражая действиям «экспертов», и впоследствии могли применять полученные навыки даже без их участия.
По мнению DeepMind, социальное обучение – это важнейшая характеристика человеческого интеллекта, и сам механизм намного эффективнее традиционных подходов машинного обучения.
Ученые полагают, что их разработка открывает перспективы для создания более «дружественных» ИИ, способных к продуктивному взаимодействию с людьми и окружающей средой.
От классики до авангарда — наука во всех жанрах