Backblaze засекла массовую миграцию трафика — ИИ пожирает интернет и меняет его ДНК

Backblaze засекла массовую миграцию трафика — ИИ пожирает интернет и меняет его ДНК

Как выглядит интернет, когда его главным пользователем становится не человек, а алгоритм.

image

Backblaze обратила внимание на сдвиг в том, как выглядит сетевой трафик вокруг её облачной инфраструктуры. По наблюдениям компании, потоки данных всё чаще напоминают не привычную интернет-нагрузку с множеством коротких соединений, а массивные и стабильные передачи, характерные для обучения и работы крупных ИИ-моделей.

Компания давно публикует отчёты о надёжности накопителей, но теперь решила регулярно показывать и сетевую картину. Новый квартальный отчёт Network Stats описывает, как данные заходят в инфраструктуру Backblaze и как они перемещаются между ней, облачными провайдерами и внешними сетями. Отчёт за 4-й квартал 2025 года стал лишь вторым по счёту, однако уже дал аналитикам много материалов для выводов.

С июня по ноябрь Backblaze зафиксировала заметный рост обмена данными между своей платформой, так называемыми неооблаками и классическими гиперскейлерами. Под неооблаками здесь понимаются провайдеры формата GPU-as-a-service, которые почти целиком сосредоточены на инфраструктуре для обучения нейросетей. В отличие от них, крупные игроки вроде AWS и Azure предлагают универсальные облака под самые разные задачи.

В статистике Backblaze трафик разбит по категориям. Компания отдельно учитывает потоки от интернет-провайдеров, CDN, хостинговых площадок и крупных облаков. В 4-м квартале данные от CDN, хостинга и ISP в целом оставались в привычных пределах. На этом фоне выделялись 2 направления: переносы данных и обмен с неооблаками.

Под миграцией Backblaze понимает передачу больших объёмов информации по выделенным оптоволоконным линиям, которые идут напрямую и не выходят в публичный интернет. Такой трафик начал расти в августе, а после октября пошёл на спад. Потоки, связанные с неооблаками, вели себя иначе. Они увеличивались с июля по ноябрь и достигли максимума в октябре.

В компании связывают эту динамику с тем, как обычно развиваются ИИ-проекты. Сначала крупные массивы данных, изображения, видео и сопутствующие метаданные, собираются и сводятся в хранилищах. Затем эти наборы выгружаются для обучения моделей и экспериментов, что и создаёт плотные и продолжительные сетевые нагрузки.

Хотя пиковые значения по обоим направлениям уже остались позади, Backblaze подчёркивает другой момент. Базовый уровень трафика после этих всплесков не вернулся к прежним значениям и закрепился выше. В компании считают, что это может говорить не о разовой активности, а о более устойчивых изменениях.

По регионам картина тоже различается (конечно, рассматривали данные по США). Самый высокий объём данных Backblaze видит в восточной части страны, где преобладает трафик от интернет-провайдеров и фиксируется большое число уникальных IP-адресов. На юге ситуация иная. Здесь сосредоточена активность неооблаков, особенно в районе Северной Вирджинии, где традиционно размещено много мощных ИИ-вычислительных кластеров.

Разница хорошо заметна по числу конечных точек. На западном побережье Backblaze взаимодействует с большим количеством разных адресов, тогда как ИИ-нагрузка на востоке сходится к ограниченному набору узлов. Такая схема соответствует устройству ИИ-пайплайнов, где хранилище и вычислительные ресурсы соединены постоянными и долгоживущими каналами.

Компания планирует и дальше публиковать сетевую статистику раз в квартал, чтобы понять, станет ли активность неооблаков повторяющейся. Дальше в планах анализ соотношения IPv4 и IPv6 и изучение того, как развиваются соединения между разными облачными платформами.