CPU Monaka - чудо 3D-стэкинга.

Fujitsu готовит процессор Monaka на 144 ядра, и в этой истории важен не только сам чип, но и то, как его собирают. За упаковку отвечает Broadcom: компания сообщила, что Monaka будет построен с использованием её технологии 3D-стэкинга, которая позволяет собирать один процессор из нескольких кристаллов, уложенных слоями и соединённых на уровне корпуса.
У Fujitsu давняя история в разработке CPU. Arm-процессор A64FX в своё время стал одной из причин, почему суперкомпьютер Fugaku в 2020 году поднялся на первое место рейтинга Top500. Monaka, судя по описанию, решает совсем другую задачу и рассчитан не только на суперкомпьютеры, а на более широкий рынок дата-центров.
Главное отличие Monaka от A64FX в подходе к памяти рядом с вычислительными ядрами. Если в A64FX делали ставку на HBM прямо на корпусе, то в Monaka от HBM на упаковке отказались. Вместо этого Fujitsu выбрала архитектуру с большим объёмом SRAM, по принципу близкую к тому, что AMD делала в линейке Genoa-X.
У Genoa-X идея строилась вокруг 3D V-Cache: сверху на вычислительные кристаллы ставили SRAM-чиплеты по 64 МБ, получая значительно увеличенный объём кэша. В самой мощной конфигурации у такого процессора суммарный L3-кэш превышал 1 ГБ. Fujitsu явно пытается повторить этот приём, но на Arm-платформе и с прицелом на типичные серверные нагрузки.
Monaka соберут из четырёх вычислительных кристаллов на техпроцессе 2 нм. На каждом из них по 36 ядер Armv9, в сумме получается 144 ядра. Сверху на эти кристаллы должны лечь четыре SRAM-чиплета, изготовленные по нормам 5 нм, то есть число вычислительных плиток и SRAM-слоёв совпадает один к одному. Дальше всё это связывается через центральный кристалл ввода-вывода и памяти: у него заявлены 12 каналов DDR5 и поддержка PCIe 6.0. Соединение между этими частями, по словам Broadcom, идёт через кремниевый интерпозер, который работает как плотная подложка-переходник для межкристальных линий.
Внешне такая схема действительно напоминает X-чипы AMD с кэшом, уложенным слоями, только вместо x86 здесь Arm. Ключевой момент в том, что подобные многокристальные системы с вертикальным стэкингом долгое время оставались зоной компетенции нескольких производителей. До недавнего времени собрать SoC такого типа могли в основном AMD и Intel.
Broadcom пытается расширить круг компаний, которые смогут выпускать подобные процессоры, через свою платформу 3.5D XDSiP, представленную в 2024 году. Расшифровка названия приводится как Extreme Dimension System in Package. По замыслу Broadcom, XDSiP должна стать более стандартизированной основой для многочиповых процессоров, похожих по идее на AMD MI300X или Intel Ponte Vecchio, где на одном корпусе живут несколько кристаллов с разными ролями.
Одна из заметных технических деталей XDSiP связана со способом стыковки кристаллов. Упоминается face-to-face hybrid bonding, то есть гибридное соединение лицом к лицу, которое повышает пропускную способность между кристаллами. Для таких архитектур это критично: при большом количестве ядер и объёмном кэше узким местом легко становится именно обмен данными между слоями.
Fujitsu, судя по всему, оказалась среди первых, кто публично подтвердил использование этой технологии Broadcom. Заказчики Broadcom обычно крайне неохотно раскрывают, какие IP-блоки и решения они берут у подрядчика. В качестве примера приводится сотрудничество Broadcom и Google по TPU: о плотной совместной работе говорят давно, но границы между вкладом Google и Broadcom далеко не всегда видны со стороны. На этом фоне откровенность Fujitsu выглядит нетипично.
Broadcom также заявила, что уже начала поставки первых 2-нм вычислительных SoC, изготовленных с использованием XDSiP. По словам представителя компании, над технологией работали почти пять лет, а образцы для Fujitsu отгрузили на этой неделе. При этом Broadcom утверждает, что технологию для своих процессоров следующего поколения выбрали и другие клиенты, помимо Fujitsu.
До появления Monaka в реальных серверах, однако, ещё далеко. Дорожная карта Fujitsu указывает запуск процессора только в 2027 году. То есть сейчас речь идёт о технологической подготовке и ранних поставках образцов, а не о продукте, который можно купить и поставить в стойку.
Monaka, судя по оценке Broadcom, лишь один из примерно шести проектов, которые сейчас разрабатываются с использованием XDSiP. При этом процессоры общего назначения, вроде Monaka, для платформы не главное направление. Около 80 процентов побед XDSiP приходятся на XPU-проекты с HBM на борту, то есть на ускорители и гибридные чипы, где высокоскоростная память снова становится центральным элементом конструкции.
Когда Broadcom объявляла XDSiP в 2024 году, платформа, по её данным, поддерживала конфигурации до 12 стеков HBM. Теперь в разработке находятся дизайны с числом стеков больше 12. Если это подтвердится в конкретных продуктах, на рынок могут выйти особенно крупные многочиповые сборки, в которых ограничение будет упираться уже не в идею архитектуры, а в практику производства и охлаждения.