Раньше газеты подшивали, теперь – просто стирают. Как медиа впали в паранойю из-за нейросетей

leer en español

Раньше газеты подшивали, теперь – просто стирают. Как медиа впали в паранойю из-за нейросетей

Медиакомпании призвали сохранить свободный доступ к архивам новостей.

image

Интернет постепенно теряет память, и происходит это не из-за сбоев или атак, а по воле самих новостных изданий. Всё больше сайтов запрещают себя архивировать, опасаясь, что старые публикации станут пищей для систем искусственного интеллекта.

Уже 23 крупных издания запретили роботу ia_archiver сохранять копии страниц в сервисе Wayback Machine, который поддерживает Internet Archive. Среди таких сайтов – USA Today и The New York Times. Парадокс в том, что часть этих же редакций сама пользуется архивом, когда готовит материалы.

Редакции боятся, что компании, работающие с искусственным интеллектом, воспользуются правилами добросовестного использования и начнут обучать модели на архивных копиях статей. На фоне роста недостоверной информации и склонности языковых моделей выдумывать правдоподобные ответы доступ к проверенной истории становится особенно важным.

Раньше роль памяти выполняли библиотеки и редакционные архивы. Газеты хранили подшивки, и любой желающий мог обратиться к прошлым публикациям. Когда издания перешли в цифровую среду, такие архивы перестали пополняться, и теперь основная надежда – на онлайн-сервисы вроде Wayback Machine.

Юридически архивировать страницы признано допустимым. В Electronic Frontier Foundation (EFF) напомнили, что, не копируя контент, невозможно создать поисковые индексы. Судебная практика подтверждает, что такие копии выполняют новую задачу – помогают находить информацию, проводить анализ и делать выводы на основе уже опубликованных материалов.

Редакции могли бы хранить свои архивы самостоятельно, но независимый архив решает другую задачу. Онлайн-материалы легко изменить задним числом, и внешний сервис позволяет зафиксировать исходную версию. Кроме того, архивы сохраняют публикации закрытых изданий, которые иначе исчезли бы без следа.

Опасения насчёт того, что ИИ будут обучать на чужих текстах, понятны. Но если полностью запретить архивировать страницы, общество пострадает сильнее, чем потенциально выиграют разработчики. Руководитель Wayback Machine Марк Грэм ведёт переговоры с редакциями, пытаясь вернуть доступ роботу. Параллельно коалиция журналистов и других участников медиасферы подписала письмо в поддержку Internet Archive и идеи свободного доступа к знаниям.