Новая инфраструктура сократит обучение ИИ на месяцы.

В Китае запустили крупнейший в мире распределённый вычислительный комплекс для искусственного интеллекта. Сеть под названием Future Network Test Facility объединяет дата-центры, расположенные примерно на двухтысячном километровом удалении друг от друга, и при этом работает почти так же эффективно, как единый суперкомпьютер.
Система начала функционировать 3 декабря. Высокоскоростная оптоволоконная сеть связывает центры в 40 городах, а суммарная протяжённость линий превышает 55 тысяч километров, чего достаточно, чтобы полтора раза обернуть экватор.
Главное достижение проекта заключается в минимальных потерях производительности в распределённой архитектуре. По словам руководителя проекта Лю Юньцзе, члена Китайской инженерной академии, сеть демонстрирует эффективность на уровне 98%. Это означает, что географически удалённые дата-центры совместно выполняют вычисления практически с той же скоростью, что и единый кластер.
Практический эффект заметнее всего при обучении больших языковых моделей. Тренировка модели с сотнями миллиардов параметров обычно требует более 500 тысяч итераций. На новой сети одна итерация занимает около 16 секунд, тогда как без специализированной инфраструктуры время могло бы увеличиться более чем на 20 секунд. В масштабе всего процесса обучение затянулось бы на несколько месяцев.
Платформа функционирует круглосуточно и способна одновременно обслуживать 128 разнородных сетей, выполняя более четырёх тысяч тестовых задач. Помимо обучения ИИ, инфраструктура рассчитана на телемедицину с удалённой диагностикой и промышленную автоматизацию с обработкой данных в реальном времени.
Проект встроен в национальную стратегию Восточные данные — западные вычисления, предусматривающую размещение дата-центров в регионах с дешёвой энергией. Идея создания такой платформы впервые появилась в 2013 году в государственной программе развития научно-технологической инфраструктуры. Кроме того, Китай активно инвестирует в фотонные и квантовые чипы, которые в будущем могут дополнительно ускорить вычисления.
Аналитики отмечают, что устойчивость сети под долговременной нагрузкой, её энергопотребление и вопросы безопасности ещё предстоит оценить на практике.