В DeepMind создали ИИ-модель, которая учится новому как человек

В DeepMind создали ИИ-модель, которая учится новому как человек

Для тренировки алгоритмов больше не нужны огромные массивы цифровых данных.

image

Команда Google DeepMind представила новаторскую модель ИИ, которая способна обучаться через социальное взаимодействие. Результаты своей работы ученые опубликовали в журнале Nature Communications .

Сейчас большинство систем ИИ, таких как ChatGPT, получают знания через анализ крупных массивов данных из интернета и других источников. Однако эксперты отмечают, что эффективность такого подхода не так уж и высока с точки зрения скорости и качества обучения.

Поиски альтернативных методов для тренировки алгоритмов ведутся уже давно. Главная цель разработчиков — «научить» ИИ осваивать новое подобно людям. В отличие от машин, человек способен перенимать навыки, наблюдая лишь за небольшим количеством примеров и без необходимости обрабатывать терабайты данных.

Ученые из DeepMind решили воссоздать этот паттерн в рамках своего эксперимента.

Они разработали виртуальный мир GoalCycle3D, включающий неровную местность с разнообразными препятствиями и цветными сферами. В этот мир были помещены программные агенты ИИ, которые должны были преодолевать препятствия и проходить сквозь сферы к целевой точке.


Первоначально агенты не получали никаких знаний о правилах виртуальной вселенной и должны были обучаться методом подкрепления — за успешные действия им начислялись вознаграждения. Также они могли многократно повторять задачи в разных, но схожих условиях. Таким образом, к концу каждого испытания агенты успевали выработать оптимальную стратегию.

Затем ученые усложнили задачу. В симуляцию были добавлены так называемые экспертные агенты, уже знающие кратчайший путь к цели.

Эксперимент показал, что обычные агенты гораздо быстрее обучались, подражая действиям «экспертов», и впоследствии могли применять полученные навыки даже без их участия.

По мнению DeepMind, социальное обучение – это важнейшая характеристика человеческого интеллекта, и сам механизм намного эффективнее традиционных подходов машинного обучения.

Ученые полагают, что их разработка открывает перспективы для создания более «дружественных» ИИ, способных к продуктивному взаимодействию с людьми и окружающей средой.

Большой брат следит за вами, но мы знаем, как остановить его

Подпишитесь на наш канал!