Twitter запустила программу bug bounty по поиску алгоритмических предубеждений

Twitter запустила программу bug bounty по поиску алгоритмических предубеждений

Заранее выявлять предубеждения в моделях машинного обучения довольно сложно, и иногда компании узнают о них только постфактум.

image

Компания Twitter объявила о своей готовности платить вознаграждение пользователям и исследователям за сообщения об «алгоритмических предубеждениях» на платформе. По словам руководства компании, это будет первым в истории соревнованием по обнаружению дискриминации пользователей со стороны алгоритмов машинного обучения. Сумма вознаграждения составит до $3,5 тыс.

«Обнаруживать предубеждения в моделях машинного обучения довольно сложно, и иногда компании узнают о непредумышленном этическом ущербе только тогда, когда они (алгоритмы – ред.) уже достигли публики», – сообщили исполнительные директоры Twitter Румман Чоудхури (Rumman Chowdhury) и Ютта Уильямс (Jutta Williams).

Челлендж по поиску предубеждений в алгоритмах машинного обучения будет базироваться на программе выплаты вознаграждения за уязвимости (bug bounty). Как отметили Чоудхури и Уильямс, модель выявления уязвимостей в сервисе с помощью хакерского сообщества также является перспективной в выявлении предубеждений.

«Мы вдохновлены тем, как сообщества исследователей и хакеров помогли специалистам в области безопасности разработать передовые методы выявления и устранения уязвимостей для защиты населения. Мы хотим создать подобное сообщество [...] для упреждающего и коллективного выявления алгоритмического ущерба», - сообщили Чоудхури и Уильямс.

Twitter заявила о запуске новой программы на фоне растущей озабоченности по поводу автоматизированных алгоритмических систем, которые, несмотря на стремление быть нейтральными, могут включать расовые или другие формы предубеждений.

Twitter, ранее в этом году выступившая с инициативой алгоритмической справедливости, заявила в мае, что отказывается от автоматической системы обрезки изображений после того, как в ходе ее проверки была обнаружена предвзятость в алгоритме, управляющем этой функцией.


Больше пяти не собираться: роботы будут следить за улицами Сингапура, хакеры атаковали проект Jenkins, во Франции арестовали экологов, данные которых раскрыл ProtonMail, а россиян беспокоит идея «социальных рейтингов». Смотрите 31-й выпуск наших новостей.