OpenAI выпустила свой первый чип Jalapeño — и намекнула Nvidia, что скоро станет жарко

leer en español

4233
OpenAI выпустила свой первый чип Jalapeño — и намекнула Nvidia, что скоро станет жарко

OpenAI выпустила свой первый чип Jalapeño — и намекнула Nvidia, что скоро станет жарко

image

OpenAI вместе с Broadcom представила чип Jalapeño для больших языковых моделей. Микросхему будут использовать в центрах обработки данных не для обучения нейросетей, а для вывода модели: этапа, когда ChatGPT, Codex или программный интерфейс OpenAI принимает запрос пользователя, считает ответ и возвращает результат.

Jalapeño стал первым специализированным процессором OpenAI для такой нагрузки. Сейчас компания закупает ускорители у внешних поставщиков, прежде всего у Nvidia, а вычислительных мощностей на рынке всё равно не хватает. Собственный чип должен дать OpenAI больше влияния на то, как работают вместе модель, программный слой, память, сеть и серверные стойки.

Broadcom описывает Jalapeño как специализированную интегральную схему, ASIC. В отличие от универсального графического ускорителя, такой чип проектируют под заранее выбранную задачу. В Jalapeño эту задачу свели к обслуживанию больших языковых моделей: обработке токенов, быстрому доступу к памяти, передаче данных между узлами и работе с большим потоком запросов.

Вывод модели стал отдельной проблемой для ИИ-индустрии. Обучение требует огромных вычислений во время крупных циклов подготовки, но затем модель нужно запускать снова и снова при каждом запросе. Чем больше людей пользуются ChatGPT, Codex и похожими сервисами, тем сильнее становятся важны задержка ответа, расход энергии, стоимость одного обращения и устойчивость сервиса при пиковом спросе.

OpenAI утверждает, что Jalapeño проектировали под реальные продукты компании, а не под отвлечённые тесты. Инженеры учитывали нагрузки ChatGPT, Codex, программного интерфейса и будущих агентных систем, где модель выполняет несколько шагов подряд, вызывает инструменты и дольше держит контекст задачи.

От первичного проекта до передачи финального дизайна в производство прошло девять месяцев. Для высокопроизводительной микросхемы срок короткий. Broadcom объясняет темп совместной работой аппаратных и программных команд, опытом в выпуске заказных чипов и применением моделей OpenAI в части инженерных задач при проектировании и оптимизации.

Инженерные образцы Jalapeño уже работают в лабораториях при целевых частоте и энергопотреблении. Broadcom указывает, что среди проверенных нагрузок была GPT-5.3-Codex-Spark. Полных характеристик пока нет: компании не раскрывают число вычислительных блоков, объём памяти, пропускную способность, техпроцесс, стоимость, результаты подробных тестов и сравнение с конкретными ускорителями.

Главный заявленный показатель сейчас - производительность на ватт. OpenAI утверждает, что ранние испытания показывают заметное преимущество Jalapeño перед нынешним передовым уровнем, но финальные замеры ещё идут. Подробный технический отчёт обещают выпустить в ближайшие месяцы. До этого чип можно оценивать только по заявленной цели: снизить лишние пересылки данных и лучше сбалансировать вычисления, память и сеть.

Для больших языковых моделей перемещение данных часто съедает не меньше ресурсов, чем сами вычисления. При генерации ответа система постоянно обращается к памяти, передаёт промежуточные результаты и распределяет работу между ускорителями. Если архитектура тратит слишком много времени и энергии на эти пересылки, вычислительные блоки простаивают. Jalapeño проектировали именно под этот узкий участок, чтобы уменьшить потери между памятью, сетью и вычислениями.

Broadcom отвечает не только за сам кремний. Компания добавляет сетевые и коммуникационные технологии, включая решения семейства Tomahawk, которые нужны для масштабирования серверных кластеров. В таких системах один чип не решает задачу сам по себе: тысячи ускорителей должны быстро обмениваться данными, иначе сеть становится главным тормозом всей платформы.

В проекте также участвует Celestica. Компания помогает с платами, стойками, системной сборкой и подготовкой оборудования к массовому развёртыванию. OpenAI нужна не отдельная микросхема для лабораторного стенда, а готовая платформа для центра обработки данных, где ускорители, память, сеть, охлаждение, серверные платы, планировщики задач и программный слой работают согласованно.

OpenAI называет Jalapeño первым шагом в многолетней линейке собственных ускорителей. Компания рассчитывает выпускать новые версии под будущие модели, продукты и режимы работы. Такой подход должен уменьшить разрыв между тем, как быстро меняются ИИ-системы, и тем, как долго обычно проектируют оборудование для них.

Пока OpenAI остаётся крупным покупателем внешних ускорителей Nvidia, доступная мощность зависит от поставок Nvidia, AMD, облачных партнёров, производителей памяти и операторов центров обработки данных. Jalapeño не снимает эту зависимость полностью, но даёт компании собственный инструмент в гонке за ограниченные вычислительные ресурсы.

Крупнейшие технологические компании уже идут похожим путём. Google развивает TPU, Amazon продвигает ускорители Trainium и Inferentia, Meta и Microsoft тоже вкладываются в специализированное железо для ИИ-нагрузок. Универсальные графические процессоры остаются мощными, но дорого стоят, быстро уходят по долгосрочным контрактам и не всегда лучше подходят для конкретной задачи.

Для Broadcom проект с OpenAI усиливает направление заказных микросхем для крупных клиентов. Компания давно поставляет чипы и инфраструктурные решения для вычислительных систем, а бум ИИ резко поднял спрос на индивидуальное железо для облачных провайдеров и разработчиков передовых моделей. Чем больше ИИ-сервисы переходят от экспериментов к постоянной работе, тем важнее становится стоимость каждого запроса.

Собственные чипы показывают, что конкуренция в ИИ уже не ограничивается моделями и интерфейсами. Скорость ответа ChatGPT, стоимость работы Codex, доступность программного интерфейса и устойчивость сервисов при пиковом спросе зависят от устройства вычислительной инфраструктуры. Если OpenAI снизит стоимость и энергопотребление вывода модели, разницу почувствуют не только инженеры, но и пользователи, которые ждут быстрых ответов без очередей и сбоев.

Первые чипы Jalapeño планируют развернуть в ЦОДах до конца 2026 года. Главный вопрос для рынка - подтвердят ли подробные тесты заявленное преимущество по производительности на ватт. Без этих цифр Jalapeño пока остаётся сильным сигналом о стратегии OpenAI, но ещё не доказывает, что компания нашла ответ на доминирование Nvidia в инфраструктуре ИИ.