Когда торт улыбается: почему мы видим лица, там, где их нет, и может ли ИИ так же?

leer en español

11:37 / 1 октября, 2024

парейдолия MIT ИИ исследования глубокое обучение LAION-5B

Исследователи из MIT раскрывают тайны парейдолии.

Ловили ли вы себя на мысли, что машины выглядят так, будто у каждой из них свои особые черты “лица”? Поверьте: вы вовсе не одиноки и не сходите с ума. Спросите хотя бы у создателей мультфильма “Тачки”...

Группа исследователей из Массачусетского технологического института (MIT) взялась за изучение любопытного явления - парейдолии. Это наша удивительная способность замечать лица и знакомые образы в самых обычных предметах. Результаты работы, опубликованные на сервере arXiv , показывают интересные различия между тем, как видят мир люди и алгоритмы.

Команда во главе с Марком Гамильтоном, аспирантом MIT, создала впечатляющую коллекцию из 5000 изображений, демонстрирующих эффект парейдолии. Это гораздо больше, чем использовалось в прежних исследованиях, где ученые работали лишь с 20-30 примерами.

Чтобы собрать такое количество материала для проекта "Faces in Things" ("Лица в вещах"), было просмотрено около 20000 картинок из базы LAION-5B. Затем добровольцы внимательно изучили каждое изображение. Они обводили рамками места, где им мерещились лица, и отвечали на вопросы о них - какие эмоции они выражают, на какой возраст похожи, случайно ли появились или были задуманы создателем предмета.

Гамильтон с теплотой отзывается о вкладе своей мамы, бывшего банковского работника, в создание этой коллекции. Она посвятила немало времени, помогая размечать изображения для анализа.

Изучая собранный материал, исследователи сделали несколько неожиданных открытий. Одно из самых удивительных наблюдений: искусственный интеллект стал гораздо лучше находить парейдолические лица только после того, как его научили распознавать мордочки животных. Этот факт подтверждает теорию об эволюционном происхождении нашей склонности видеть лица где попало. Возможно, она берет начало в жизненно важном для наших предков умении быстро замечать притаившихся хищников или определять, куда смотрит потенциальная добыча. Гамильтон предполагает, что корни парейдолии могут уходить глубже социального поведения человека, к самым основам выживания.

Еще одно интригующее открытие ученые назвали "Золотой серединой парейдолии" - это особый тип изображений, где иллюзорные лица возникают чаще всего. Уильям Т. Фримен, профессор MIT и главный исследователь проекта, поясняет: есть определенный уровень визуальной сложности, при котором и люди, и компьютеры с наибольшей вероятностью "увидят" лицо там, где его на самом деле нет.

Исследователи даже создали математическую модель, которая описывает, как люди и компьютеры обнаруживают иллюзорные лица. Анализ уравнения выявил четкую закономерность - "парейдолический пик". В этой точке вероятность увидеть несуществующее лицо достигает максимума. Пик соответствует изображениям с оптимальным уровнем сложности - не слишком простым, но и не перегруженным деталями.

Работа MIT - не просто любопытный эксперимент: применить ее результаты можно во многих технологических сферах. Например, чтобы улучшить технологии обнаружения лиц, снизив количество ложных срабатываний. Такие системы есть во множестве современных изобретений - от беспилотных автомобилей до роботов и интерфейсов для умного дома.

Более того, собранные данные и разработанные инструменты могут пригодиться дизайнерам. Понимание механизмов парейдолии позволит создавать более привлекательные и дружелюбные на вид продукты. Гамильтон приводит пример: "Представьте, что можно автоматически подкорректировать внешний вид машины или детской игрушки, чтобы они выглядели приветливее. Или убедиться, что медицинский прибор случайно не напугает и без того взволнованного пациента во время операции”.

Он задается вопросами: "Почему люди и компьютеры так по-разному воспринимают окружающий мир? Помогает нам парейдолия или мешает? Почему машины, которых мы создаем по своему подобию, мыслят иначе?" Хотя парейдолия давно известна психологам, ее почти не изучали с точки зрения компьютерного зрения.

Ученые готовятся представить свои находки научному сообществу и уже строят планы на будущее. В дальнейшем они хотят научить искусственный интеллект не просто находить парейдолические лица, но и описывать их словами.

Когда торт улыбается: почему мы видим лица, там, где их нет, и может ли ИИ так же?

Роботы-матки: человечность снята с производства

Подпишитесь на email рассылку