Spotify усиливает защиту после массового скрейпинга, который авторы утечки называют проектом ради сохранности музыки.

Spotify заблокировал ряд аккаунтов после того, как команда Anna’s Archive выложила в открытый доступ массив данных, собранный со стриминговой платформы: по их словам, речь идёт о 86 миллионах музыкальных файлов и огромной базе метаданных. В компании подчёркивают, что это не «взлом» её систем, а незаконное массовое скачивание через пользовательские учётные записи, нарушающее правила сервиса.
Как рассказали в Spotify, они выявили и отключили «вредоносные» аккаунты, которые использовались для скрейпинга, а также добавили новые меры защиты от подобных атак, связанных с обходом авторских ограничений. В компании отдельно отметили, что с самого начала выступают на стороне артистов и партнёров индустрии, защищая их права, и продолжают мониторинг подозрительной активности.
Anna’s Archive, называющая себя «крупнейшей по-настоящему открытой библиотекой в истории человечества», объявила о публикации данных 20 декабря. В блоге проекта говорится, что обычно они сосредоточены на текстах, но их миссия по сохранению культуры «не различает типы медиа», поэтому музыка — лишь ещё одно направление «архива ради сохранности». Авторы утверждают, что нашли способ собирать данные со Spotify «в промышленных масштабах» и решили начать «архив сохранения» именно со стриминга, потому что там уже собрана огромная часть того, что слушает мир.
По описанию Anna’s Archive, полный выпуск включает базу метаданных о 256 миллионах треков, а также «bulk»-файл объёмом чуть меньше 300 терабайт с 86 миллионами музыкальных файлов — это, как заявляется, около 99,6% всех прослушиваний на Spotify. Отдельно опубликован и более компактный набор с 10 000 самых популярных песен. Выложенные материалы охватывают музыку, размещённую на платформе с 2007 года по июль 2025-го, а сам проект называет этот массив «крупнейшей публично доступной базой музыкальных метаданных».
Spotify настаивает, что публикация стала результатом систематического нарушения условий сервиса: часть музыки в течение месяцев «выдёргивали» из потокового прослушивания методом stream-ripping. При этом, по версии компании, доступ к корпоративным системам не получали, а действия выполнялись через учётные записи, оформленные третьей стороной. Также Spotify говорит, что Anna’s Archive не связывалась с ними до публикации.
В своём посте Anna’s Archive приводит и наблюдения по данным Spotify: например, суммарное число прослушиваний у трёх самых популярных треков — Billie Eilish - Birds of a Feather, Lady Gaga - Die with a Smile и Bad Bunny - DtMF — в сумме набрали больше прослушиваний, чем «дно» каталога, то есть десятки миллионов наименее прослушиваемых композиций.
Anna’s Archive давно вызывает претензии правообладателей: проект заблокирован в нескольких странах из-за систематических нарушений авторских прав. Он появился после того, как в 2022 году правоохранители закрыли Z-Library, а Минюст США сообщил об аресте и обвинениях в адрес двух администраторов платформы. Anna’s Archive возник спустя несколько дней после закрытия Z-Library и стал агрегировать записи оттуда, а также из других библиотек, включая Internet Archive, Library Genesis и Sci-Hub.