Новый 3D-чип собирают слоями как небоскрёб, чтобы данные летали между памятью и вычислениями без пробок.

Команда инженеров из США представила прототип «монолитного» 3D-чипа, который впервые изготовили в коммерческом производстве в США и который уже в тестах показал заметный выигрыш по скорости по сравнению с привычными 2D-решениями. Идея проста и эффектна: вместо плоской «платы с деталями» исследователи построили чип как многоэтажное здание, где вычислительные блоки и память размещаются слоями друг над другом, а вертикальные соединения работают как сеть скоростных лифтов для данных.
Для современных моделей ИИ проблема давно упирается не столько в вычисления, сколько в доставку данных. Память хранит информацию, вычислительные блоки её обрабатывают, и между ними постоянно идёт обмен огромными объёмами. На обычных 2D-чипах всё разложено на одной плоскости: памяти рядом мало, маршруты длинные и перегруженные, поэтому вычисления часто «простаивают» в ожидании данных — это называют «стеной памяти». Долгие годы индустрия пробивала эту стену уменьшением транзисторов и уплотнением схем, но и этот путь упирается в физические ограничения, которые исследователи называют «стеной миниатюризации».
Новый прототип пытается обойти обе стены буквально вверх. По словам участников проекта, вертикальная интеграция позволяет держать память и логику ближе друг к другу и резко сократить расстояния, на которых гоняются данные. В этом помогает рекордная плотность вертикальных соединений и «переплетение» памяти с вычислительными узлами между слоями, что снижает типичные узкие места плоских архитектур. Руководитель проекта со стороны Стэнфорда Субхасиш Митра, представивший работу на 71-й конференции IEEE IEDM, считает, что такие подходы — один из реальных путей к будущим аппаратным скачкам, которых потребуют новые поколения ИИ-систем.
Ключевое отличие от многих прежних 3D-экспериментов в том, как именно собираются слои. Ранее чаще стековали уже готовые кристаллы, но такие «сэндвичи» ограничены крупными и редкими межслойными контактами, которые сами становятся бутылочным горлышком. Здесь же слои строятся последовательно прямо один поверх другого в едином процессе, причём при достаточно низких температурах, чтобы не повредить нижние уровни. Такой «монолитный» подход делает укладку плотнее и позволяет соединять слои гораздо более густой сетью вертикальной проводки.
Отдельно исследователи подчёркивают производственную сторону: процесс целиком реализовали в американской коммерческой кремниевой фабрике. В SkyWater говорят, что превращение академической идеи в технологию, которую способен повторить реальный фаб, — задача сама по себе тяжёлая, и демонстрация такой совместимости важна не меньше, чем цифры производительности.
С цифрами тоже всё небезынтересно. Ранние аппаратные тесты показали преимущество прототипа над сопоставимыми 2D-чипами примерно в четыре раза. А в моделировании более «высоких» версий, где слоёв памяти и вычислений будет больше, прирост на реальных ИИ-нагрузках достигает двенадцатикратного — в том числе на задачах, производных от открытой модели LLaMA от Meta. В долгой перспективе авторы называют ещё более амбициозную цель: выйти на 100–1000-кратные улучшения по метрике energy-delay product, которая учитывает одновременно скорость и энергопотребление. Логика в том, что если резко сократить перемещение данных и дать им множество коротких вертикальных путей, то можно одновременно поднять пропускную способность и снизить энергию на операцию — сочетание, которое для плоских архитектур долго выглядело почти недостижимым.
В проекте видят не только «ускоритель ради ускорителя», но и задел под новую школу инженеров, которым придётся мыслить 3D-интеграцией так же естественно, как предыдущие поколения мыслили плоскими кристаллами. В качестве одной из опор для этого направления упоминаются совместные программы и финансирование, включая Microelectronics Commons California-Pacific-Northwest AI Hardware Hub, где уже готовят специалистов под будущую вертикальную электронику. Как говорит участник проекта Х.-С. Филип Вонг, вопрос здесь не только в рекордах производительности, но и в способности быстрее создавать новые аппаратные идеи и быстрее доводить их до производства.