OpenAI представила Jalapeño — первый ИИ-чип собственной разработки для инференса искусственного интеллекта

25.06.2026

~ 2 мин

Простой

Новости

Введение

Компания OpenAI официально анонсировала свой первый специализированный ИИ-чип для под названием Jalapeño, разработанный совместно с Broadcom. Процессор создан с нуля для выполнения задач инференса больших языковых моделей в инфраструктуре OpenAI и представляет собой ASIC-ускоритель с 4 банками памяти HBM3E. Инженерные образцы Jalapeño уже используются в лабораториях OpenAI и выполняют рабочие нагрузки машинного обучения, включая работу над моделью GPT‑5.3‑Codex‑Spark. Первые коммерческие развертывания Jalapeño запланированы на конец 2026 года, а к 2029 году OpenAI намерена обеспечить чипами собственной разработки вычислительные мощности до 10 гигаватт.

Подробнее о OpenAI Jalapeño

Jalapeño — это ASIC-ускоритель (вроде Google TPU или AWS Trainium), оптимизированный исключительно для задач логического вывода LLM, а не для обучения нейросетей: чип способен выполнять матричные умножения, обработку механизма внимания, деквантизации и подобные операции. Архитектурно Jalapeño представляет собой многокристальный чип с интерпозером, крупным вычислительным кристаллом в центре, окруженным 8 стеками памяти HBM3E — визуально чип смахивает на графические процессоры Nvidia H100\H200. Набор функциональный блоков, иерархия и объем памяти пока не раскрываются, но известно, что чип будет поддерживать сетевые технологии Broadcom класса Tomahawk непосредственно на кристалле, что позволит объединять ИИ-процессоры Jalapeño в мощные кластеры с сотнями чипов для работы с искусственным интеллектом. Причем, по словам OpenAI, Jalapeño будет поддерживать работу как с моделями GPT, так и другими LLM.

Разработка ASIC-ускорителя Jalapeño от первоначальных чертежей до готовности к производству заняла всего девять месяцев — это один из самых быстрых циклов разработки в истории полупроводниковой индустрии. Такой темп стал возможен благодаря глубокой программно-аппаратной интеграции с использованием собственных моделей OpenAI для ускорения проектирования и оптимизации и тесному сотрудничеству с Broadcom и Celestica: первая взяла на себя основные тяжбы разработки аппаратной составляющей чипа, а вторая отвечает за разработку плат и стоечных систем.

Также известно, что ключевым аппаратным преимуществом архитектуры Jalapeño будет минимизация перемещения данных внутри системы и балансировка вычислительных, сетевых ресурсов и объема памяти для достижения максимальной утилизации оборудования и снижения задержек. Со слов OpenAI, внутренние тесты показывают, что Jalapeño обеспечивает значительно лучшую производительность на ватт по сравнению с современными ИИ-ускорителями конкурентов. Генеральный директор Broadcom Хок Тан заявил, что Jalapeño работает на одном уровне с топовыми чипами Nvidia Blackwell Google TPU в задачах ИИ-инференса, попутно снижая стоимость инференса на 50%. OpenAI пока не раскрывает конкретные технические характеристики (техпроцесс, количество ядер, пиковую производительность в FLOPS), но обещает дать подробный технический отчет уже в ближайшие месяцы. Первые платформы на базе Jalapeño будут развернуты в дата-центрах Microsoft и других партнёров уже к концу 2026 года, с последующим масштабированием в последующие годы.

ASIC-ускоритель OpenAI Jalapeño. Источник: X.

Выводы

OpenAI наконец-то перестала быть просто софтверной компанией и начала создавать собственный аппаратный стек — компания больше не обязана выстраивать очередь за GPU Nvidia и мириться с дефицитом, она может замещать часть инференс-мощностей своими чипами Jalapeño. Сам факт, что Jalapeño сделан с нуля за девять месяцев и уже работает с GPT‑5.3‑Codex‑Spark в лаборатории, говорит о том, что OpenAI не просто экспериментирует, а полностью готова к выходу на рынок серверных ИИ-ускорителей. И если первый чип закрывает только инференс, то следующий шаг — обучение. Но есть нюанс. Для ChatGPT и массовых пользователей это, скорее всего, ничего не изменит в ближайшие пару лет. Основной выигрыш — внутри самой OpenAI: снижение операционных затрат на инференс, возможность масштабироваться без оглядки на поставщиков и полный контроль над стеком.

Автор:

Serverflow