Google Cloud анонсировал новые инстансы для искусственного интеллекта на базе собственных серверных центральных процессоров Axion и тензорных процессоров Ironwood седьмого поколения. Новые решения ориентированы на обучение и логический вывод крупных ИИ-моделей с низкой задержкой, а также они будут интегрироваться в инфраструктуру нового ИИ-гиперкомпьютера.
Подробнее о TPU v7 Ironwood
Ironwood TPU v7 от Google демонстрирует производительность 4614 FP8 TFLOPS и оснащен 192 ГБ памяти HBM3E с пропускной способностью до 7,37 ТБ/с. Тензорные чипы можно масштабировать в кластере до 9216 ИИ-ускорителей, обеспечивая в сумме 42,5 EFLOPS FP8, что значительно превышает возможности передовых вычислительных систем Nvidia GB300 NVL72 (720 PFLOPS или 0,72 EFLOPS в FP8), однако важно учитывать, что GB300 NVL72 вмещают лишь 72 графических процессора GB300, поэтому TPU просто давят их производительность числом. Каждый под с TPU Ironwood объединяется через особое межчиповое соединение от Google (название неизвестно) со скоростью 9,6 Тбит/с, а общий объем памяти достигает 1,77 ПБ HBM3E, что также превосходит емкость решений конкурентов.
Тензорный процессор Ironwood седьмого поколения от Google. Источник: .
Подробнее о CPU Axion
Помимо TPU, Google также представил свои первые серверные процессоры общего назначения Axion на базе архитектуры Armv9. Они обеспечивают до 50% более высокую производительность и на 60% лучшую энергоэффективность, чем современные x86-процессоры, а также на 30% большую производительность, чем аналогичные Arm-инстансы, применяемые в облаке. Axion поддерживает до 96 виртуальных ЦП, до 768 ГБ памяти DDR5 (в инстансе C4A Metal), 80 МБ L3-кэша, DDR5-5600 MT/s и унифицированный доступ к памяти (UMA). Серверы на базе Axion и Ironwood используют контроллеры Titanium, разгружающие CPU от сетевых и I/O операций, что также повышает производительность.
Google предлагает три конфигурации центральных процессоров Axion:
C4A — основной инстанс, до 72 виртуальных ЦП, 576 ГБ DDR5, сеть 100 Гбит/с, SSD Titanium до 6 ТБ.
N4A — для общих рабочих нагрузок, до 64 виртуальных ЦП, 512 ГБ DDR5, сеть 50 Гбит/с.
C4A Metal — инстанс с доступом ко всему аппаратному стеку Axion, до 96 виртуальных ЦП, 768 ГБ DDR5, сеть 100 Гбит/с, для специализированных приложений и ИИ-разработки.
Серверный центральный процессор Axion от Google. Источник: .
Подробнее о ИИ-гиперкомпьютере Google
Тензорные чипы Ironwood, объединенные с процессорами Axion, могут формировать кластеры с сотнями тысяч чипов, создавая полноценный гиперкомпьютер Google для ИИ. Платформа объединяет вычислительные ресурсы, хранилища и сетевой под единым управлением. Для повышения надежности используется реконфигурируемая сетевая архитектура Optical Circuit Switching, которая мгновенно перенаправляет трафик в случае сбоев, обеспечивая полную отказоустойчивость всей системы. Использование новейшего суперкластера повышает рентабельность инвестиций на 353% за три года, снижает расходы на TCO на 28% и повышает операционную эффективность на 55% для корпоративных клиентов. Anthropic уже объявила о своих планах использовать до миллиона TPU для работы ИИ-моделей Claude, а компания Lightricks будет примять Ironwood для обучения и обслуживания мультимодальной системы LTX-2.
Выводы
Axion и Ironwood — это не просто очередной релиз новых процессоров, а результат более чем десятилетней работы Google над созданием собственного процессорного стека, который позволит компании получить полную независимость от внешних поставщиков оборудования для искусственного интеллекта. Google строит будущее ИИ, объединяя вычислительные мощности, энергоэффективность и масштабируемость в рамках единой экосистемы, которая полностью построена на внутренних разработках компании.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.