ИИ научился строить картели без людей: машины мстят за скидки и завышают цены. Антимонопольное право бессильно

leer en español

ИИ научился строить картели без людей: машины мстят за скидки и завышают цены. Антимонопольное право бессильно

1000 итераций кода — и экономика уже играет против нас.

image

Представьте небольшой город, где работают два торговца, продающих одинаковый товар. Каждый стремится привлечь покупателей более низкой ценой, и в итоге оба получают минимальную прибыль. Устав от постоянного соперничества, они тайно встречаются в трактире и обсуждают план — одновременно поднять цены, чтобы перестать конкурировать и зарабатывать больше. Но такие договорённости запрещены антимонопольным законодательством, поэтому предприниматели отказываются от идеи, сохраняя низкие цены для жителей.

Так работает классическая модель свободного рынка, которой в США придерживаются уже более века: запретить тайные сговоры — и конкуренция сама удержит цены на справедливом уровне. Однако в цифровую эпоху всё усложнилось. Всё чаще продавцы доверяют ценообразование не людям, а алгоритмам, автоматически подстраивающим стоимость под спрос и действия соперников. Эти программы анализируют данные, пробуют разные подходы и выбирают те, что обеспечивают наибольшую прибыль. Формально они не нарушают закон, но их поведение иногда напоминает результат настоящего сговора.

В 2019 году учёные смоделировали рынок с двумя такими алгоритмами и позволили им самостоятельно искать оптимальные стратегии. После сотен итераций программы выработали схему «возмездия»: если одна снижала цену, другая резко обрушивала свою, создавая угрозу ценовой войны. В итоге обе стороны пришли к устойчивому равновесию — цены оставались завышенными, но ни один алгоритм не решался первым снизить стоимость. Никаких соглашений не было, но результат напоминал согласованные действия.

С тех пор экономисты и специалисты по машинному обучению пытаются понять, как контролировать алгоритмическое ценообразование. Поиск явного сговора здесь бесполезен: программы не договариваются и не взаимодействуют напрямую. Они лишь реагируют на статистику и выбирают оптимальные шаги, однако именно из этих реакций может складываться устойчивая система завышенных цен.

Чтобы объяснить это явление, команда Пенсильванского университета под руководством компьютерного учёного Аарона Рота применила математический аппарат теории игр. Этот раздел на стыке информатики и экономики изучает, как участники рынка выстраивают стратегию с учётом поведения конкурентов. Учёные исследовали работу так называемых алгоритмов без сожаления — систем, которые учатся на собственных ошибках и постепенно приходят к оптимальному поведению. На простом примере вроде «камень-ножницы-бумага» такая программа перестаёт повторять проигрышные ходы и достигает равновесия, при котором никто не может улучшить результат, изменив тактику.

В начале 2000-х математики доказали: если две такие программы взаимодействуют, они неизбежно приходят к справедливому исходу, где ни одна не имеет преимущества. На этом основании исследователи из Северо-Западного университета предположили, что на реальном рынке два алгоритма без сожаления тоже будут поддерживать конкурентные цены, а значит, сговор невозможен. Но новое исследование показало, что ситуация сложнее.

Аспирантка Натали Коллина и её коллега Эшвар Аруначалесваран рассмотрели сценарий, где одна система с нулевым сожалением соперничает с другой — внешне безобидной, но не реагирующей на поведение оппонента. Экономисты называют такую стратегию «нерасполагающей ответом»: программа заранее задаёт вероятности для разных решений и выбирает их случайным образом, не обращая внимания на действия соперника. Казалось бы, угрожать или координировать поведение она не может. Однако именно такая пассивная схема неожиданно вызвала рост цен.

Оптимальный набор вероятностей для этой стратегии оказался смещён в сторону дорогих предложений. В результате первая система, обучающаяся на ошибках, начала подстраиваться под «тихого» противника и постепенно повышала цены, чтобы не проигрывать. Вторая при этом зарабатывала больше, время от времени снижая стоимость и опережая конкурента. Обе стороны оставались довольны: их доходы сравнялись и достигли максимума при условии, что никто не меняет алгоритм. Так возникло устойчивое равновесие с завышенными ценами — состояние, внешне напоминающее сговор, но без малейшего взаимодействия.

Для регуляторов такой сценарий — настоящая головоломка. Нельзя запретить алгоритмы без сожаления: именно они обеспечивают честную конкуренцию. Но и полностью пассивные схемы формально не нарушают закон — они не реагируют на рынок и не обмениваются сигналами. Тем не менее при их сочетании страдает покупатель: рынок может самопроизвольно застрять в состоянии высоких цен, где никому не выгодно что-либо менять.

Некоторые эксперты предлагают радикальный выход — разрешить только те алгоритмы, у которых можно подтвердить свойство отсутствия сожаления. В 2024 году группа Джейсона Хартлайна из Северо-Западного университета создала метод, позволяющий проверять это свойство без доступа к исходному коду. Но даже такая проверка не исключает всех рисков, особенно если рядом с программами действуют люди, поведение которых далеко от идеальной рациональности.

Главная проблема в том, что классические признаки сговора — обмен информацией, согласованные действия, угрозы — здесь отсутствуют. Алгоритмы не осознают собственных решений и не способны договариваться, но итог тот же: рынок ведёт себя как при картеле. Поэтому экономисты всё чаще говорят о необходимости нового подхода к регулированию, который учитывает не только намерения участников, но и непреднамеренные последствия машинного обучения. Ведь, как шутит Аарон Рот, «ошибаться не запрещено», — но теперь ошибка кода может стоить покупателям дороже, чем любая встреча в дымном трактире.