OpenAI выпустила свой первый чип Jalapeño — и намекнула Nvidia, что скоро станет жарко

OpenAI вместе с Broadcom представила чип Jalapeño для больших языковых моделей. Микросхему будут использовать в центрах обработки данных не для обучения нейросетей, а для вывода модели: этапа, когда ChatGPT, Codex или программный интерфейс OpenAI принимает запрос пользователя, считает ответ и возвращает результат.
Jalapeño стал первым специализированным процессором OpenAI для такой нагрузки. Сейчас компания закупает ускорители у внешних поставщиков, прежде всего у Nvidia, а вычислительных мощностей на рынке всё равно не хватает. Собственный чип должен дать OpenAI больше влияния на то, как работают вместе модель, программный слой, память, сеть и серверные стойки.
Broadcom описывает Jalapeño как специализированную интегральную схему, ASIC. В отличие от универсального графического ускорителя, такой чип проектируют под заранее выбранную задачу. В Jalapeño эту задачу свели к обслуживанию больших языковых моделей: обработке токенов, быстрому доступу к памяти, передаче данных между узлами и работе с большим потоком запросов.
Вывод модели стал отдельной проблемой для ИИ-индустрии. Обучение требует огромных вычислений во время крупных циклов подготовки, но затем модель нужно запускать снова и снова при каждом запросе. Чем больше людей пользуются ChatGPT, Codex и похожими сервисами, тем сильнее становятся важны задержка ответа, расход энергии, стоимость одного обращения и устойчивость сервиса при пиковом спросе.
OpenAI утверждает, что Jalapeño проектировали под реальные продукты компании, а не под отвлечённые тесты. Инженеры учитывали нагрузки ChatGPT, Codex, программного интерфейса и будущих агентных систем, где модель выполняет несколько шагов подряд, вызывает инструменты и дольше держит контекст задачи.
От первичного проекта до передачи финального дизайна в производство прошло девять месяцев. Для высокопроизводительной микросхемы срок короткий. Broadcom объясняет темп совместной работой аппаратных и программных команд, опытом в выпуске заказных чипов и применением моделей OpenAI в части инженерных задач при проектировании и оптимизации.
Инженерные образцы Jalapeño уже работают в лабораториях при целевых частоте и энергопотреблении. Broadcom указывает, что среди проверенных нагрузок была GPT-5.3-Codex-Spark. Полных характеристик пока нет: компании не раскрывают число вычислительных блоков, объём памяти, пропускную способность, техпроцесс, стоимость, результаты подробных тестов и сравнение с конкретными ускорителями.
Главный заявленный показатель сейчас - производительность на ватт. OpenAI утверждает, что ранние испытания показывают заметное преимущество Jalapeño перед нынешним передовым уровнем, но финальные замеры ещё идут. Подробный технический отчёт обещают выпустить в ближайшие месяцы. До этого чип можно оценивать только по заявленной цели: снизить лишние пересылки данных и лучше сбалансировать вычисления, память и сеть.
Для больших языковых моделей перемещение данных часто съедает не меньше ресурсов, чем сами вычисления. При генерации ответа система постоянно обращается к памяти, передаёт промежуточные результаты и распределяет работу между ускорителями. Если архитектура тратит слишком много времени и энергии на эти пересылки, вычислительные блоки простаивают. Jalapeño проектировали именно под этот узкий участок, чтобы уменьшить потери между памятью, сетью и вычислениями.
Broadcom отвечает не только за сам кремний. Компания добавляет сетевые и коммуникационные технологии, включая решения семейства Tomahawk, которые нужны для масштабирования серверных кластеров. В таких системах один чип не решает задачу сам по себе: тысячи ускорителей должны быстро обмениваться данными, иначе сеть становится главным тормозом всей платформы.
В проекте также участвует Celestica. Компания помогает с платами, стойками, системной сборкой и подготовкой оборудования к массовому развёртыванию. OpenAI нужна не отдельная микросхема для лабораторного стенда, а готовая платформа для центра обработки данных, где ускорители, память, сеть, охлаждение, серверные платы, планировщики задач и программный слой работают согласованно.
OpenAI называет Jalapeño первым шагом в многолетней линейке собственных ускорителей. Компания рассчитывает выпускать новые версии под будущие модели, продукты и режимы работы. Такой подход должен уменьшить разрыв между тем, как быстро меняются ИИ-системы, и тем, как долго обычно проектируют оборудование для них.
Пока OpenAI остаётся крупным покупателем внешних ускорителей Nvidia, доступная мощность зависит от поставок Nvidia, AMD, облачных партнёров, производителей памяти и операторов центров обработки данных. Jalapeño не снимает эту зависимость полностью, но даёт компании собственный инструмент в гонке за ограниченные вычислительные ресурсы.
Крупнейшие технологические компании уже идут похожим путём. Google развивает TPU, Amazon продвигает ускорители Trainium и Inferentia, Meta и Microsoft тоже вкладываются в специализированное железо для ИИ-нагрузок. Универсальные графические процессоры остаются мощными, но дорого стоят, быстро уходят по долгосрочным контрактам и не всегда лучше подходят для конкретной задачи.
Для Broadcom проект с OpenAI усиливает направление заказных микросхем для крупных клиентов. Компания давно поставляет чипы и инфраструктурные решения для вычислительных систем, а бум ИИ резко поднял спрос на индивидуальное железо для облачных провайдеров и разработчиков передовых моделей. Чем больше ИИ-сервисы переходят от экспериментов к постоянной работе, тем важнее становится стоимость каждого запроса.
Собственные чипы показывают, что конкуренция в ИИ уже не ограничивается моделями и интерфейсами. Скорость ответа ChatGPT, стоимость работы Codex, доступность программного интерфейса и устойчивость сервисов при пиковом спросе зависят от устройства вычислительной инфраструктуры. Если OpenAI снизит стоимость и энергопотребление вывода модели, разницу почувствуют не только инженеры, но и пользователи, которые ждут быстрых ответов без очередей и сбоев.
Первые чипы Jalapeño планируют развернуть в ЦОДах до конца 2026 года. Главный вопрос для рынка - подтвердят ли подробные тесты заявленное преимущество по производительности на ватт. Без этих цифр Jalapeño пока остаётся сильным сигналом о стратегии OpenAI, но ещё не доказывает, что компания нашла ответ на доминирование Nvidia в инфраструктуре ИИ.