Top.Mail.Ru
Обзор ИИ-ускорителей Huawei Atlas и Ascend: сравнение моделей для задач искусственного интеллекта | Блог Serverflow Скачать
прайс-лист
Бесплатная
доставка по РФ
Уважаемые клиенты, 12.06 и 13.06 магазин ServerFlow не работает. Все оформленные заявки будут обработаны 16.06.
Всех с праздником! С Днем России!
Distribution of
Server Components
8 (800) 222-70-01 Консультация IT-специалиста Сравнение
Обзор ИИ-ускорителей Huawei Atlas и Ascend: сравнение моделей для задач искусственного интеллекта

Автор:

Обзор ИИ-ускорителей Huawei Atlas и Ascend: сравнение моделей для задач искусственного интеллекта

Рассказываем о многообразии китайских ИИ-ускорителей Huawei Atlas и Ascend.

Введение Китайская компания Huawei широко известна на весь мир своими передовыми технологическими решениями, которые включают в себя как бытовую электронику, так и оборудование для вычислительных систем. Пул технологий Huawei настолько велик, что компании удается активно конкурировать с ведущими IT-гигантами во множестве областей, включая выпуск решений для обучения и развертывания передовых LLM — Huawei Atlas и Ascend. В этой статье мы расскажем вам, что из себя представляют решения Atlas и Ascend, расскажем о технических характеристиках всех моделей этих семейств ИИ-ускорителей, а также объясним, какое из решений лучше всего выбрать. Краткий ликбез Поскольку лор ИИ-решений Huawei крайне запутан и многообразен, мы решили составить для вас удобную таблицу, в которой отмечено краткое описание всех решений линеек Atlas и Ascend: Дата выхода Низкопрофильная плата Подходит для инференса Подходит для обучения Процессор Huawei Atlas 300i 32 GB LPDDR4X 2019 год ✅ ✅ ❌ Ascend 310  Huawei Atlas 300I Pro 24 GB LPDDR4X 2021 год ✅ ✅ ❌ Ascend 310P Huawei Atlas 300i Duo 96 GB LPDDR4X 2022 год ❌ ✅ ❌ 2x Ascend 310P Huawei Atlas 300I A2 - ✅ ✅ ✅ Ascend 310P Huawei Atlas 300V 24 ГБ LPDDR4X  2022 год ✅ ❌ ❌ Ascend 310P Huawei Atlas 300V Pro 48 ГБ LPDDR4X 2021 ✅ ❌ ❌ Ascend 310P Huawei Atlas 300T 32 GB HBM  2022 год ❌ ✅ ✅ Ascend 910 Huawei Atlas 300T A2 64 GB HBM2 - ❌ ✅ ✅ Ascend 910B Huawei Ascend 910B 32 GB HBM2 2022 год ❌ ✅ ✅ Ascend 910B Huawei Ascend 910C HBM2 анонс 2024 год ❌ ✅ ✅ Ascend 910С Huawei Ascend 920 HBM3 анонс 2025 год ❌ ✅ ✅ Ascend 920 Как Huawei позиционирует устройства Atlas и Ascend Прежде чем говорить о многообразии моделей Atlas и Ascend, стоит объяснить, как компания Huawei продвигает свои решения. Во-первых, Atlas и Ascend — это не типичные профессиональные GPU. Huawei Atlas и Ascend представляют собой ИИ-ускорители, оптимизированные исключительно под задачи искусственного интеллекта и машинного обучения благодаря использованию NPU-чипов Ascend, а не стандартных графических процессоров. На этих устройствах не получится заниматься рендерингом графики, моделированием или запуском видеоигр — только инференс и обучение больших языковых моделей. Стоит отметить, что решения Huawei Atlas и Ascend также отлично справляются с обработкой видеопотока. ИИ-ускорители Atlas и в особенности Ascend используются в частных и государственных вычислительных инфраструктурах Китая, включая дата-центры для разработки новейших китайских LLM и оборонных комплексах КНР. Также устройства Atlas нередко применяются в системах краевых вычислений с интегрированным искусственным интеллектом, например, системах видеонаблюдения или медицинских аппаратах для диагностики.  Несмотря на то, что устройства Huawei Ascend и Atlas в первую очередь предназначены для местного рынка Китая, некоторые модели можно приобрести и за пределами страны. К примеру, PCIe-платы Atlas 300i, 300I Pro и 300V Pro официально поставляются в составе серверов Huawei или как отдельные компоненты через партнеров, а ускорители Ascend 910 B/C не продаются как отдельные модули, а встраиваются в серверы Atlas 800, причем, из-за санкций приобрести их в США и ЕС невозможно. Huawei очень щепетильно относится к дизайну своих устройств, вследствие чего ИИ-ускорители Huawei Atlas 300 дважды стали победителем премии RedDot — в 2019 и 2023 году. Как отметили жюри, решения компании отличаются симметричной и сбалансированной эстетикой, отражающей стабильность и надежность. Источник: RedDot. Ускорители инференса ИИ Huawei Atlas Линейка ускорителей Huawei Atlas — это специализированные решения в виде PCI-e плат для выполнения задач искусственного интеллекта, ориентированные на инференс моделей и обработку данных в реальном времени. В отличие от традиционных GPU от Nvidia с архитектурой CUDA, эти устройства используют уникальную архитектуру процессора для искусственного интеллекта Da Vinci, разработанную Huawei и оптимизированную для матричных операций, тензорных вычислений, что обеспечивает высокую энергоэффективность и производительность при работе с новейшими LLM. Например, модель Atlas 300 поддерживает до 32 TFLOPS (FP16) и анализ 80 каналов 1080p-видео одновременно, при этом имея скромный TDP в 67 Вт, что делает ее идеальной для систем видеонаблюдения и систем умного города.  Более продвинутая версия, Atlas 300I Pro обеспечивает 70 TFLOPS (FP16), а также 80-канальную видеоаналитику. Это решение активно применяется в финансовом секторе для автоматического распознавания документов и анализа страховых случаев, где критически важны скорость обработки и точность. Для масштабных задач, таких как анализ транспортных потоков или распознавание номерных знаков, Huawei предлагает Atlas 300V Pro с поддержкой 64 каналов видео в разрешении 4K. Сервер Huawei Atlas 800 Inference, в которые интегрируются платы линейки Atlas. Источник: Huawei. Для краевых вычислений (edge computing) Huawei предлагает компактные решения, такие как Atlas 200, которые встраиваются в камеры или дроны. Эти устройства потребляют всего 8 Вт, но обеспечивают до 16 TOPS (INT8), что делает их пригодными для эффективной работы в системах IoT. Решения Huawei Atlas классифицируются по трем основным сценариям использования — карты для инференса LLM имеют индекс “i”, карты для обработки видео и изображений имеют индекс “V”, а карты для обучения обозначаются индексом “T”. Huawei Atlas 300I Ускоритель Huawei Atlas 300i, выпущенный в 2019 году — это специализированное решение для задач искусственного интеллекта и обработки изображений, построенное на уникальной архитектуре Da Vinci 3D Cube. В Huawei Atlas 300i используются матричные процессоры Ascend 310 (16 TOPS), оптимизированные для операций с тензорами и матрицами. ИИ-процессор Huawei Ascend 310 включает аппаратные блоки для квантования данных (INT8/FP16), ускорения трансформеров и декодирования видео (H.265, 4K/60 FPS). Карта оснащена 32 ГБ памяти LPDDR4X с пропускной способностью 204.8 ГБ/с и поддерживает 80-канальную видеоаналитику в реальном времени в разрешении 1080p/25 FPS, что делает ее ключевым элементом систем умного города, промышленного IoT и кибербезопасности. Конечно, весьма устаревший формат памяти на фоне остальных прорывных характеристик PCIe карты смотрится весьма странно, однако, для инференса языковых моделей использование LPDDR4X будет не критичным. Наиболее примечательно, что Huawei Atlas 300i имеет низкопрофильный форм-фактор и при своих габаритах предлагает высочайший уровень производительности — такого сочетания не предлагает ни один из современных GPU от западных производителей. Еще одна особенность Atlas 300i — интеграция с экосистемой MindSpore, включая автоматическую оптимизацию языковых моделей и защиту данных через технологию Secure Boot. Примечательно, что Atlas 300i изначально позиционировалась как решение для инференса и обучения ИИ, однако, в последующих моделях ускорителей Atlas фокус сместился именно на инференс LLM. Энергопотребление не превышает 67 Вт благодаря использованию 12-нм техпроцесса и динамического управления ресурсами, что на 40% эффективнее, чем у ускорителей конкурентов того же ценового сегмента. Стоит отметить, что Huawei Atlas 300i поддерживает операционные системы CentOS и Ubuntu. PCI-e карта Huawei Atlas 300I имеет компактный форм-фактор, что позволяет интегрировать ее в одноюнитовый сервер. Характеристика Huawei Atlas 300i Дата-выхода 2019 год Форм-фактор Низкопрофильная карта расширений Процессор искусственного Интеллекта Ascend 310  Формат памяти 32 ГБ LPDDR4X Общая пропускная способность 204,8 ГБ/с Поддерживаемые кодеки H.264, H.265 Интерфейс PCIe x16 Gen3.0 INT8 88 TOPS FP16 44 TFLOPS TDP 67 Вт Huawei Atlas 300I Pro Huawei Atlas 300I Pro — это миниатюрная PCIe карта для инференса ИИ 2021 года выпуска, которая является модифицированной версией Huawei Atlas 300i для внутреннего рынка Китая. Поскольку Atlas 300I Pro также является низкопрофильной, ее можно очень удобно интегрировать в серверы без необходимости подключать дополнительное питание. Как и в случае своего предшественника, ускоритель Atlas 300 Pro создан на базе чипов Ascend, но на усовершенствованной версии 310P с архитектурой Da Vinci. Ввиду использования улучшенного ИИ-чипа, Atlas 300 Pro имеет большую производительность в режимах INT8 и FP16. Также Atlas 300I Pro поддерживает новый интерфейс PCIe 4.0, тогда как Atlas 300I поддерживала стандарт PCIe 3.0. Примечательно, что в отличие от стандартной карты Atlas 300I с 32 ГБ памяти LPDDR4X, Pro-версия имеет уменьшенный объем памяти до 24 ГБ LPDDR4X. Это обуславливается специализацией карты, которая предназначена исключительно для инференса искусственного интеллекта, но решение уменьшить объем VRAM все равно очень спорное. Конечно, можно предположить, что в 2021 году еще не существовало ИИ-моделей с колоссальным количеством параметров, как у DeepSeek R1 671b, но в современных реалиях 24 ГБ видеопамяти уже не выглядит конкурентоспособно, а высокая производительность выглядит излишне. PCIe карта Huawei Atlas 300i Pro может справится с такой задачей, как запуск множества сеансов для работы с ИИ благодаря производительности в 70 TFLOPS FP16, однако, такой сценарий использования тоже сомнителен из-за сравнительно небольшого объема памяти. Ввиду всех нововведений, модифицированная ИИ-карта имеет увеличенный TDP до 72 Вт. При этом, Huawei заявляет, что энергоэффективность решения составляет 2 TOPS на 1 Вт, что в 2,1 выше, чем у ИИ-решений линейки Atlas 200, применяемых в промышленном сегменте. PCI-e карты линейки Huawei Atlas 300 для инференса и анализа видео выглядят идентично друг другу, тогда как модели с индексом “T” и “A2” имеют уникальный дизайн, а Atlas 300i Duo имеют увеличенный, двухслотовый форм-фактор. Источник: Baidu. Характеристика Huawei Atlas 300i Pro Дата-выхода 2021 год Форм-фактор Низкопрофильная карта расширений ИИ-Процессор Ascend 310P, 8 ядер с частотой 1,9 ГГц Формат памяти 24 ГБ LPDDR4X Общая пропускная способность 204,8 ГБ/с Шина памяти 384-бит Поддерживаемые кодеки H.264, H.265 Интерфейс PCIe x16 Gen4.0 INT8 140 TOPS FP16 70 TFLOPS TDP 72 Вт Huawei Atlas 300I Duo Huawei Atlas 300i Duo — это однослотовое, полнопрофильное решение для инференса тяжелых моделей ИИ с увеличенным объемом памяти, представленное в 2022 году. Atlas 300i Duo оснащен двумя ИИ-чипами Ascend 310P с суммарным количеством ядер в 16 штук, объем памяти увеличен до 96 ГБ LPDDR4X, а также доступна упрощенная конфигурация с 48 ГБ VRAM. Колоссальный объем памяти в 96 ГБ необходим для возможности развертывания больших языковых моделей с полным числом параметров без применения квантизации, благодаря чему даже в современных реалиях Atlas 300i Duo выглядит вполне конкурентоспособно в сравнении с ускорителями Nvidia H100 и A100. Несмотря на это, стоимость Atlas 300i Duo кратно ниже, чем цены на решения конкурентов, поскольку ускоритель от Huawei оптимизирован только для инференса LLM. Устройство демонстрирует ИИ-производительность до 280 TOPS (INT8) и 140 TFLOPS (FP16), поддерживает гибридные вычисления для задач компьютерного зрения, NLP и видеоаналитики, включая обработку 256 каналов HD-видео (1080p) в режиме реального времени с аппаратным кодированием/декодированием H.265/JPEG. Интеграция с экосистемой Huawei, включая систему Mind Studio и репозитории TensorFlow, PyTorch и ONNX упрощает развертывание языковых моделей в гибридных средах. Основные сценарии использования Atlas 300i Duo включают облачный инференс LLM, умные системы видеонаблюдения, IoT, автономный транспорт и системы безопасности, требующие обработки данных с низкой задержкой и высокой пропускной способностью памяти. Коэффициент энергоэффективности решения составляет 1,86 TOPS на 1 Вт. Используя 6 ускорителей Atlas 300i Duo, вы можете собрать высокопроизводительную и при этом энергоэффективную систему с огромным объемом VRAM для развертывания передовых языковых моделей, таких как DeepSeek R1 671b и llama* 4. На самом деле, Atlas 300i Duo стала по-настоящему народным ИИ-ускорителем в Китае и ее регулярно можно увидеть в обзорах по развертыванию отечественных LLM. Поскольку Huawei Atlas 300i Duo является стандартной, однослотовой платой расширений, для ее питания используется разъем 8-pin. Также на рендере видно, что решение имеет два интегрированных процессора Ascend 310P. Источник: Baidu. Характеристика Huawei Atlas 300i Duo Дата-выхода 2022 год Форм-фактор Однослотовая карта ИИ-Процессор 2x Ascend 310P, 16 ядер с частотой 1,9 ГГц Формат памяти до 96 ГБ LPDDR4X ECC Общая пропускная способность 408 ГБ/с Поддерживаемые кодеки H.264, H.265 Интерфейс PCIe x16 Gen4.0 INT8 280 TOPS FP16 140 TFLOPS TDP 150 Вт Huawei Atlas 300I A2 Huawei Atlas 300I A2 — это новейшая низкопрофильная карта линейки Atlas 300I, первые упоминания которой появились в январе 2025 года. По всей видимости, это решение является наиболее производительной PCIe картой линейки Atlas 300I, близкое по производительности к решениям Atlas 300T. На сайте Huawei не представлено подробной информации об этих решениях, однако, на сайте компании Quanaichina, которая является дочерней организацией Huawei, указаны некоторые данные о Atlas 300I A2. По всей видимости, новое решение будет предназначено именно для обучения моделей искусственного интеллекта, а не инференса, что нехарактерно для линейки Atlas 300I. Ввиду этого, можно предположить, что Atlas 300I A2 будут иметь память формата HBM и увеличенную производительность в режимах FP16 и INT8. Также известно, что PCIе карта будет иметь двухслотовый форм-фактор, в ней будет использоваться процессор Ascend 310P, а ее TDP будет достигать 350 Вт. Кроме того, максимальное поддерживаемое разрешение Atlas 300I A2 для статичных изображений достигает 16384 x 16384, а для видеоматериалов — 8192 x 8192. Также поддерживается декодирования JPEG в 1080p/12288 FPS, благодаря чему Atlas 300I A2 будут идеальным решением для интеграции в систем видеонаблюдения для распознавания лиц, таких как “умный город”, которые особенно актуальны в Китае ввиду огромного объема населения.  Новейшие видеокарты линейки Huawei Atlas 300I A2. Источник: Quanaichina. Huawei Atlas 300V Huawei Atlas 300V — компактная PCIe карта 2022 года выпуска, которая предназначена для эффективной обработки видеопотоков, а также поддерживает различный ИИ-функционал благодаря наличию ИИ-процессора. По сути, карта расширений Huawei Atlas 300V является полным аналогом Atlas 300I Pro, оптимизированным не для инференса ИИ, а для работы с видео и изображениями. По всей видимости, компания Huawei имеет в своем арсенале технологии, которые позволяют удобно менять соотношение ИИ-блоков и блоков обработки видео, от которого и будет зависеть дальнейшая спецификация решений. Ввиду этого Atlas 300V повторяет практически все характеристики оригинальной карты, однако, ИИ-производительность решения, очевидно, снижена ввиду пониженных требований, а количество каналов обработки видео в разрешении 1080p/25FPS расширено до 100. Также поддерживается функция декодирования JPEG 4K 384FPS, а максимальное доступное разрешение — 8192 x 8192. Области применения PCIe карт Huawei Atlas 300V весьма ограничены — данные решения можно эффективно применять в системах умного видеонаблюдения и системах “умный город 2.0”, что обуславливается поддержкой огромного количества видеопотоков. PCIe карта Huawei Atlas 300V для анализа видеопотока с прозрачной крышкой, через которую видно материнскую плату и процессор устройства. Источник: Baidu. Характеристика Huawei Atlas 300V Дата-выхода 2022 год Форм-фактор Низкопрофильная карта расширений ИИ-Процессор 1x Ascend 310P, 8 ядер Формат памяти 24 ГБ LPDDR4X ECC Общая пропускная способность 204,8 ГБ/с Поддерживаемые кодеки H.264, H.265 Интерфейс PCIe x16 Gen4.0 INT8 100 TOPS FP16 50 TFLOPS TDP 72 Вт Huawei Atlas 300V Pro Huawei Atlas 300V Pro — усовершенствованная плата расширений для видеоанализа Atlas 300V, которая имеет увеличенный объем видеопамяти, улучшенную ИИ-производительность, а также поддерживает обработку до 128 видеопотоков в разрешении 1080p/25FPS в режиме реального времени. Примечательно, что при двукратном увеличении объема видеопамяти, Huawei оставили пропускную способность на уровне 204,8 ГБ/с — возможно, это было сделано во избежание роста тепловыделения, так как он остался на уровне Atlas 300V. В отличие от предыдущей версии карты расширений для обработки видеопотоков, решение Atlas 300V Pro имеет более широкий пул сценариев использования, например, в системах умных финансов, автоматизированного распознавания транспорта, обеспечения безопасности в городской среде и парковых зонах и так далее. Именно для поддержки продвинутых ИИ-функций, таких как распознавание лиц, фиксирование автомобильных номеров, нахождение объектов и распознавание движений, Atlas 300V Pro имеют производительность до 70 TFLOPS в режиме FP16. Рендер PCIe карты Huawei Atlas 300V Pro для анализа видеопотока в разобранном виде. На изображении также показан NPU-чип Ascend 310P. Источник: Huawei. Характеристика Huawei Atlas 300V Дата-выхода 2021 год Форм-фактор Низкопрофильная карта расширений ИИ-Процессор 1x Ascend 310P, 8 ядер Формат памяти 48 ГБ LPDDR4X ECC Общая пропускная способность 204,8 ГБ/с Поддерживаемые кодеки H.264, H.265 Интерфейс PCIe x16 Gen4.0 INT8 140 TOPS FP16 70 TFLOPS TDP 72 Вт Huawei Atlas 300T Huawei Atlas 300T — это особое ИИ-решение линейки Atlas, которое оптимизировано не для инференса языковых моделей, а для их обучения. Atlas 300T недоступны для отдельной покупки и поставляются только в составе высокопроизводительных серверов для дата-центров корпоративного уровня. В отличие от ускорителей для инференса LLM, Atlas 300T имеет колоссальный уровень производительности до 256 TFLOPS в режиме FP16, что обуславливается интеграцией особого чипа Ascend 910, который состоит, предположительно, из тензорных ядер NPU и вычислительных ядер TaiShan. Поскольку процессор Ascend 910 является самым первым представителем семейства чипов Ascend, в котором Huawei лишь тестировала новые технологии, точное соотношение NPU и CPU ядер неизвестно. Для достижения наиболее эффективного обучения искусственного интеллекта, в решения Atlas 300T интегрирована гибридная память — 32 ГБ HBM и 16 ГБ DDR4, последняя нужна для выполнения вспомогательных задач. Такая конфигурация ядер и памяти объясняется тем, что Ascend 910 изначально предполагался как NPU-процессор, но впоследствии в него интегрировали HBM-память, сделав из него гибрид NPU и GPU.Примечательно, что Huawei Atlas 300T, по сути является первым представителем линейки ИИ-ускорителей Huawei Ascend 910, поскольку последующие поколения этого семейства базируются в корпусе Atlas 300T — в них меняется лишь гибридный чип Ascend. Так как ускорители Atlas 300T позиционируются как решения корпоративного уровня для работы в высокопроизводительных вычислительных кластерах Atlas 900, они имеют сетевой интерфейс 100GE QSFP-DD и поддержкой технологии RoCE. Такой же подход к интеграции сетевых возможностей в ИИ-решений можно встретить в конвергентных ускорителях Nvidia A100X, в которые представляют собой гибрид DPU и GPU. Ввиду двухслотовой конфигурации, карта Huawei Atlas 300T имеет разъем питания 8-pin. PCI-e карта Huawei Atlas 300T в разобранном виде. Как видно на рендере, на материнской плате ускорителя расположен графический процессор Ascend 910 с HBM-памятью, вокруг которого располагаются чипы памяти DDR4. Источник: Huawei. Характеристика Huawei Atlas 300T Дата-выхода 2022 год Форм-фактор Двухслотовая карта расширений ИИ-Процессор Ascend 910 Формат памяти 32 ГБ HBM, 16 ГБ DDR4 ECC Общая пропускная способность 800 ГБ/с Поддерживаемые кодеки H.264, H.265 Интерфейс PCIe x16 Gen4.0 Сетевые возможности 1x порт 100GE QSFP-DD INT8 - FP16 256 TFLOPS TDP 300 Вт Huawei Atlas 300T A2 Huawei Atlas 300T A2 — это улучшенная конфигурация ускорителя Atlas 300T, которая имеет увеличенные показатели ИИ-производительности, до 2 портов 200GE RoCE v2. В сети практически нет информации о картах расширений Atlas 300T A2, поскольку эти решения пока что не были выпущены компанией Huawei. Также известно, что чипы Atlas 300T A2 поддерживают передовые центральные процессоры Kunpeng 920 с 48 ядрами. Судя по информации, полученной из китайских форумов, Atlas 300T A2 имеет гибридный процессор следующего поколения Ascend 910B, который позднее использовался в одноименных ИИ-ускорителях для обучения ИИ. Стоит отметить, что в отличие от своего предшественника, Atlas 300T A2 поддерживает более современный формат сверхбыстрой памяти HBM2. В данный момент ускорители обучения LLM Atlas 300T A2 еще даже не были анонсированы, однако, на китайских сайтах можно найти ряд сливов, указывающих на анонс новейших ИИ-решений уже в мае 2025 года. PCI-e плата расширений для обучения ИИ Huawei Atlas 300T A2. Источник: Baidu. Характеристика Huawei Atlas 300T A2 Дата-выхода - Форм-фактор Двухслотовая карта расширений ИИ-Процессор Ascend 910B, 46 ядер частотой 2,2 ГГц Формат памяти 64 ГБ HBM2, 16 ГБ DDR4 ECC Общая пропускная способность 800 ГБ/с  Поддерживаемые кодеки H.264, H.265 Интерфейс PCIe x16 Gen5.0 Сетевые возможности 2x порта 200GE RoCE v2 INT8 280 TOPS FP16 280 TFLOPS FP32 75 TFLOPS TDP 330 Вт Ускорители обучения ИИ Huawei Ascend Ускорители для обучения ИИ линейки Ascend представляют собой флагманские, высокопроизводительные решения компании Huawei, созданные для конкуренции с топовыми чипами Nvidia. Если первые решения линейки Ascend, такие как модели ускорителей Ascend 910 представляли собой сырое, недоработанное решение с массой недостатков, то новейшие устройства вроде Ascend 910C и 920 вполне способны эффективно конкурировать с западными ИИ-ускорителями, например, H100 и H20. Сравнение размеров чипов для ИИ-решений Huawei Atlas и Huawei Ascend. Огромной разницей в габаритах процессоров и обуславливается значительный прирост производительности между Ascend 310 и Ascend 910. Источник: Baidu. В основе их архитектуры лежит использование памяти HBM, что обеспечивает исключительную пропускную способность до 3.2 ТБ/с, а вычислительная мощность достигает 800 TFLOPS в операциях с FP16, что составляет около 80% от возможностей H100. Кроме того, ИИ-ускорители Ascend также базируются на одноименных NPU-чипах на собственной архитектуре Da Vinci, которая также применяется в разработке PCIe плат для инференса ИИ Atlas. ИИ-ускорители Ascend не выпускаются в формате PCI-E, а интегрируются в специализированные серверные системы, например, в серверы Huawei Atlas 800. Последние представляют собой масштабируемые платформы, объединяющие до 32 ускорителей в рамках единого кластера, что позволяет обрабатывать сложные задачи обучения нейросетей и инференса. Важно отметить, что структура проектирования ускорителей Ascend очень напоминает ИИ-решения Nvidia, причем, как по внешнему виду, так и по способу масштабирования — старшие чипы представляют собой несколько младших чипа, соединенных между собой интерконнектом. Сервер Huawei Atlas 800 Training, в которые интегрируются ИИ-ускорители линейки Ascend. Источник: Huawei. Серверные стойки, такие как Huawei CloudMatrix 384, также демонстрируют системный подход компании к масштабированию ИИ-инфраструктуры. Эти решения аналогичны Nvidia NVL72 и объединяют до 384 ускорителей Ascend 910C с оптическими соединениями. Для эффективной работы ускорителей, в серверы и кластеры Huawei интегрируются с центральные процессоры Huawei Kunpeng, благодаря чему компании удается создать полностью обособленную экосистему, оптимизированную под задачи машинного обучения. Например, кластеры CloudMatrix 384 распределены по 16 стойкам, где каждая содержит 32 GPU, связанных через высокоскоростные оптические интерфейсы, минимизирующие задержки. Несмотря на более высокое энергопотребление (в 3.9 раза выше, чем у GB200 NVL72), такие системы идеально подходят для рынка Китая, где доступ к дешевой энергии и государственная поддержка ИИ-инфраструктуры компенсируют все недостатки. При этом, Huawei активно развивает программную экосистему, чтобы преодолеть разрыв производительности в сравнении с решениями на архитектуре CUDA, пытаясь полностью импортозаместить западные ИИ-технологии. Серверный кластер Huawei Atlas 900 AI PoD. Источник: Huawei. Huawei Ascend 910B Huawei Ascend 910B — это первые успешные ИИ-ускорители для обучения LLM от Huawei, представленные в 2022 году, которые позиционировались как аналог ускорителей Nvidia A100. Основой ускорителя является одноименный чип Ascend 910B, который производится по техпроцессу 7-нм SMIC (N+1) на усовершенствованной архитектуре New DaVinci, которые, по сравнению с предыдущей версией Ascend 910, предлагают большую энергоэффективность и поддержку современных форматов вычислений, таких как FP16 и INT8. Несмотря на использование менее продвинутого техпроцесса SMIC по сравнению с TSMC (из-за санкций США), Huawei удалось достичь значительного прогресса в увеличении производительности по сравнению с ускорителями Huawei 910, хотя увеличение размера кристалла (до 665.61 мм²) указывает на компромиссы в плотности транзисторов. Помимо этого, в решениях Ascend 910B используется высокоскоростная память формата HBM2 объемом 32 ГБ, что обеспечивает значительный прирост эффективности при обучении нейросетей.  Гибридный процессор Ascend 910B, который используется в одноименных ИИ-ускорителях. Источник: Baidu. Характеристика Huawei Ascend 910B Дата выхода 2022 год ИИ-Процессор 25 ядер New DaVinci Формат памяти HBM2 32 ГБ Общая пропускная способность 800 ГБ/с Интерфейс PCIe 4.0 INT8 640 TOPS FP16 320 TFLOPS TDP 310 Вт Huawei Ascend 910C Huawei Ascend 910C — передовые ИИ-ускорители, благодаря которым весь мир узнал, что китайская микропроцессорная промышленность может соперничать с передовыми решениями Nvidia. Huawei Ascend 910C, анонсированные в 2024 году, представляет собой два чипа Ascend 910B на 7-нм техпроцессе SMIC, объединенных на одной подложке. Компания Huawei заявляет, что им удалось добиться показателя производительности, которые составляет 60% от ИИ-эффективности решений Nvidia H100. Huawei Ascend 910C все еще не вышли в продажу и о них мало что известно, так как решения предназначены исключительно для местного рынка, однако, первые отгрузки устройств начнутся уже в мае 2025 года и к тому времени можно ожидать появления первых обзоров и подобных характеристик.  ИИ-ускоритель для обучения искусственного интеллекта Huawei Ascend 910C, предположительно, будет состоять из корпуса PCIe карты Huawei Atlas 300T нового поколения и гибридного чипа Ascend 910C, подобно структуре своего предшественника в лице Ascend 910B. Источник: Baidu. Huawei Ascend 920 Huawei Ascend 920 — это новейшие ИИ-решения Huawei, анонсированные в 2025 году и призванные заменить ускорители Nvidia H20 после ввода торговых ограничений со стороны США. О характеристиках ускорителей Ascend 920 в данный момент практически ничего неизвестно, однако, пользователи предполагают, что производительность решений в режиме FP16 достигнет колоссальных 900 TFLOPS, память обновится до формата HBM3, пропускная способность увеличится до 4 ТБ/с, а сами чипы будут производиться по передовому техпроцессу SMIC 6-нм. Кроме того, модификация 920C, предназначенная для обучения моделей с архитектурой Transformer и Mixture of Experts, по сообщениям инсайдеров, превысит производительность стандартного Ascend 920 примерно на 30–40%. Если упомянутые характеристики подтвердятся, то ускорители Ascend 920 могут действительно стать заменой не только решений H20, но и полноценных ускорителей Nvidia H100, полностью вытеснив западные компании с китайского рынка. Предполагается, что полноценного выхода Huawei Ascend 920 стоит ждать не раньше второй половины 2025 года.  Процессоры для ИИ-ускорителей Huawei Ascend 910 и Nvidia GH100 имеют практически идентичную архитектуру кристалла чипа.  Что же выбрать? Выбор ИИ-решения от Huawei зависит исключительно от потребностей вашего бизнеса, причем, подобрать наиболее подходящую PCI-e карту или ИИ-ускоритель будет очень удобно благодаря классификации семейств устройств. Если вы хотите приобрести компактное решение с высокой производительностью для инференса языковых моделей, то вам идеально подойдут устройства Atlas 300i. Для обучения более продвинутых LLM и их интеграции в бизнес-приложения могут отлично послужить решения Atlas 300T с высочайшей производительностью и наличием HBM-памяти. В свою очередь, в целях возведения полномасштабных дата-центров для разработки новейших моделей искусственного интеллекта идеальным вариантом станут решения семейства Ascend, которые практически ничем не уступают ИИ-ускорителям от Nvidia при кратно меньшей стоимости.  Вывод Очевидно, что за последние несколько лет Китай превратился из сильно отстающей в отрасли микропроцессорной промышленности страны в законодателя мод индустрии искусственного интеллекта. А с учетом череды внезапных анонсов ускорителей Ascend 910C и 920, можно с уверенностью заявить, что Китай уже практически вплотную подобрался к уровню производительности, который предлагает компания Nvidia. Если новейшие решения Ascend 910C и 920 после своего выхода действительно предложат производительность и характеристики, которые от них ожидает все мировое сообщество, то Китай не просто выровняется, но и обойдет США в технологической гонке, став мировым лидером в сфере IT-промышленности.

Обзор ИИ-ускорителей Huawei Atlas и Ascend: сравнение моделей для задач искусственного интеллекта

~ 20 мин
1393
Сложный
Статьи
Обзор ИИ-ускорителей Huawei Atlas и Ascend: сравнение моделей для задач искусственного интеллекта

Введение

Китайская компания Huawei широко известна на весь мир своими передовыми технологическими решениями, которые включают в себя как бытовую электронику, так и оборудование для вычислительных систем. Пул технологий Huawei настолько велик, что компании удается активно конкурировать с ведущими IT-гигантами во множестве областей, включая выпуск решений для обучения и развертывания передовых LLM — Huawei Atlas и Ascend. В этой статье мы расскажем вам, что из себя представляют решения Atlas и Ascend, расскажем о технических характеристиках всех моделей этих семейств ИИ-ускорителей, а также объясним, какое из решений лучше всего выбрать.

Краткий ликбез

Поскольку лор ИИ-решений Huawei крайне запутан и многообразен, мы решили составить для вас удобную таблицу, в которой отмечено краткое описание всех решений линеек Atlas и Ascend:

Дата выхода

Низкопрофильная плата

Подходит для инференса

Подходит для обучения

Процессор

Huawei Atlas 300i 32 GB LPDDR4X

2019 год

Ascend 310 

Huawei Atlas 300I Pro 24 GB LPDDR4X

2021 год

Ascend 310P

Huawei Atlas 300i Duo 96 GB LPDDR4X

2022 год

2x Ascend 310P

Huawei Atlas 300I A2

-

Ascend 310P

Huawei Atlas 300V 24 ГБ LPDDR4X 

2022 год

Ascend 310P

Huawei Atlas 300V Pro 48 ГБ LPDDR4X

2021

Ascend 310P

Huawei Atlas 300T 32 GB HBM 

2022 год

Ascend 910

Huawei Atlas 300T A2 64 GB HBM2

-

Ascend 910B

Huawei Ascend 910B 32 GB HBM2

2022 год

Ascend 910B

Huawei Ascend 910C HBM2

анонс 2024 год

Ascend 910С

Huawei Ascend 920 HBM3

анонс 2025 год

Ascend 920


Как Huawei позиционирует устройства Atlas и Ascend

Прежде чем говорить о многообразии моделей Atlas и Ascend, стоит объяснить, как компания Huawei продвигает свои решения. Во-первых, Atlas и Ascend — это не типичные профессиональные GPU. Huawei Atlas и Ascend представляют собой ИИ-ускорители, оптимизированные исключительно под задачи искусственного интеллекта и машинного обучения благодаря использованию NPU-чипов Ascend, а не стандартных графических процессоров. На этих устройствах не получится заниматься рендерингом графики, моделированием или запуском видеоигр — только инференс и обучение больших языковых моделей. Стоит отметить, что решения Huawei Atlas и Ascend также отлично справляются с обработкой видеопотока. ИИ-ускорители Atlas и в особенности Ascend используются в частных и государственных вычислительных инфраструктурах Китая, включая дата-центры для разработки новейших китайских LLM и оборонных комплексах КНР. Также устройства Atlas нередко применяются в системах краевых вычислений с интегрированным искусственным интеллектом, например, системах видеонаблюдения или медицинских аппаратах для диагностики. 

Несмотря на то, что устройства Huawei Ascend и Atlas в первую очередь предназначены для местного рынка Китая, некоторые модели можно приобрести и за пределами страны. К примеру, PCIe-платы Atlas 300i, 300I Pro и 300V Pro официально поставляются в составе серверов Huawei или как отдельные компоненты через партнеров, а ускорители Ascend 910 B/C не продаются как отдельные модули, а встраиваются в серверы Atlas 800, причем, из-за санкций приобрести их в США и ЕС невозможно.

Huawei Atlas 300 выиграли премию RedDot
Huawei очень щепетильно относится к дизайну своих устройств, вследствие чего ИИ-ускорители Huawei Atlas 300 дважды стали победителем премии RedDot — в 2019 и 2023 году. Как отметили жюри, решения компании отличаются симметричной и сбалансированной эстетикой, отражающей стабильность и надежность. Источник: RedDot.

Ускорители инференса ИИ Huawei Atlas

Линейка ускорителей Huawei Atlas — это специализированные решения в виде PCI-e плат для выполнения задач искусственного интеллекта, ориентированные на инференс моделей и обработку данных в реальном времени. В отличие от традиционных GPU от Nvidia с архитектурой CUDA, эти устройства используют уникальную архитектуру процессора для искусственного интеллекта Da Vinci, разработанную Huawei и оптимизированную для матричных операций, тензорных вычислений, что обеспечивает высокую энергоэффективность и производительность при работе с новейшими LLM. Например, модель Atlas 300 поддерживает до 32 TFLOPS (FP16) и анализ 80 каналов 1080p-видео одновременно, при этом имея скромный TDP в 67 Вт, что делает ее идеальной для систем видеонаблюдения и систем умного города. 

Более продвинутая версия, Atlas 300I Pro обеспечивает 70 TFLOPS (FP16), а также 80-канальную видеоаналитику. Это решение активно применяется в финансовом секторе для автоматического распознавания документов и анализа страховых случаев, где критически важны скорость обработки и точность. Для масштабных задач, таких как анализ транспортных потоков или распознавание номерных знаков, Huawei предлагает Atlas 300V Pro с поддержкой 64 каналов видео в разрешении 4K.

Huawei Atlas 800 Inference
Сервер Huawei Atlas 800 Inference, в которые интегрируются платы линейки Atlas. Источник: Huawei.

Для краевых вычислений (edge computing) Huawei предлагает компактные решения, такие как Atlas 200, которые встраиваются в камеры или дроны. Эти устройства потребляют всего 8 Вт, но обеспечивают до 16 TOPS (INT8), что делает их пригодными для эффективной работы в системах IoT. Решения Huawei Atlas классифицируются по трем основным сценариям использования — карты для инференса LLM имеют индекс “i”, карты для обработки видео и изображений имеют индекс “V”, а карты для обучения обозначаются индексом “T”.

Huawei Atlas 300I

Ускоритель Huawei Atlas 300i, выпущенный в 2019 году — это специализированное решение для задач искусственного интеллекта и обработки изображений, построенное на уникальной архитектуре Da Vinci 3D Cube. В Huawei Atlas 300i используются матричные процессоры Ascend 310 (16 TOPS), оптимизированные для операций с тензорами и матрицами. ИИ-процессор Huawei Ascend 310 включает аппаратные блоки для квантования данных (INT8/FP16), ускорения трансформеров и декодирования видео (H.265, 4K/60 FPS). Карта оснащена 32 ГБ памяти LPDDR4X с пропускной способностью 204.8 ГБ/с и поддерживает 80-канальную видеоаналитику в реальном времени в разрешении 1080p/25 FPS, что делает ее ключевым элементом систем умного города, промышленного IoT и кибербезопасности. Конечно, весьма устаревший формат памяти на фоне остальных прорывных характеристик PCIe карты смотрится весьма странно, однако, для инференса языковых моделей использование LPDDR4X будет не критичным. Наиболее примечательно, что Huawei Atlas 300i имеет низкопрофильный форм-фактор и при своих габаритах предлагает высочайший уровень производительности — такого сочетания не предлагает ни один из современных GPU от западных производителей. Еще одна особенность Atlas 300i — интеграция с экосистемой MindSpore, включая автоматическую оптимизацию языковых моделей и защиту данных через технологию Secure Boot. Примечательно, что Atlas 300i изначально позиционировалась как решение для инференса и обучения ИИ, однако, в последующих моделях ускорителей Atlas фокус сместился именно на инференс LLM. Энергопотребление не превышает 67 Вт благодаря использованию 12-нм техпроцесса и динамического управления ресурсами, что на 40% эффективнее, чем у ускорителей конкурентов того же ценового сегмента. Стоит отметить, что Huawei Atlas 300i поддерживает операционные системы CentOS и Ubuntu.

Huawei Atlas 300i
PCI-e карта Huawei Atlas 300I имеет компактный форм-фактор, что позволяет интегрировать ее в одноюнитовый сервер.

Характеристика

Huawei Atlas 300i

Дата-выхода

2019 год

Форм-фактор

Низкопрофильная карта расширений

Процессор искусственного Интеллекта

Ascend 310 

Формат памяти

32 ГБ LPDDR4X

Общая пропускная способность

204,8 ГБ/с

Поддерживаемые кодеки

H.264, H.265

Интерфейс

PCIe x16 Gen3.0

INT8

88 TOPS

FP16

44 TFLOPS

TDP

67 Вт


Huawei Atlas 300I Pro

Huawei Atlas 300I Pro — это миниатюрная PCIe карта для инференса ИИ 2021 года выпуска, которая является модифицированной версией Huawei Atlas 300i для внутреннего рынка Китая. Поскольку Atlas 300I Pro также является низкопрофильной, ее можно очень удобно интегрировать в серверы без необходимости подключать дополнительное питание. Как и в случае своего предшественника, ускоритель Atlas 300 Pro создан на базе чипов Ascend, но на усовершенствованной версии 310P с архитектурой Da Vinci. Ввиду использования улучшенного ИИ-чипа, Atlas 300 Pro имеет большую производительность в режимах INT8 и FP16. Также Atlas 300I Pro поддерживает новый интерфейс PCIe 4.0, тогда как Atlas 300I поддерживала стандарт PCIe 3.0. Примечательно, что в отличие от стандартной карты Atlas 300I с 32 ГБ памяти LPDDR4X, Pro-версия имеет уменьшенный объем памяти до 24 ГБ LPDDR4X. Это обуславливается специализацией карты, которая предназначена исключительно для инференса искусственного интеллекта, но решение уменьшить объем VRAM все равно очень спорное. Конечно, можно предположить, что в 2021 году еще не существовало ИИ-моделей с колоссальным количеством параметров, как у DeepSeek R1 671b, но в современных реалиях 24 ГБ видеопамяти уже не выглядит конкурентоспособно, а высокая производительность выглядит излишне. PCIe карта Huawei Atlas 300i Pro может справится с такой задачей, как запуск множества сеансов для работы с ИИ благодаря производительности в 70 TFLOPS FP16, однако, такой сценарий использования тоже сомнителен из-за сравнительно небольшого объема памяти. Ввиду всех нововведений, модифицированная ИИ-карта имеет увеличенный TDP до 72 Вт. При этом, Huawei заявляет, что энергоэффективность решения составляет 2 TOPS на 1 Вт, что в 2,1 выше, чем у ИИ-решений линейки Atlas 200, применяемых в промышленном сегменте.

Huawei Atlas 300i Pro
PCI-e карты линейки Huawei Atlas 300 для инференса и анализа видео выглядят идентично друг другу, тогда как модели с индексом “T” и “A2” имеют уникальный дизайн, а Atlas 300i Duo имеют увеличенный, двухслотовый форм-фактор. Источник: Baidu.

Характеристика

Huawei Atlas 300i Pro

Дата-выхода

2021 год

Форм-фактор

Низкопрофильная карта расширений

ИИ-Процессор

Ascend 310P, 8 ядер с частотой 1,9 ГГц

Формат памяти

24 ГБ LPDDR4X

Общая пропускная способность

204,8 ГБ/с

Шина памяти

384-бит

Поддерживаемые кодеки

H.264, H.265

Интерфейс

PCIe x16 Gen4.0

INT8

140 TOPS

FP16

70 TFLOPS

TDP

72 Вт


Huawei Atlas 300I Duo

Huawei Atlas 300i Duo — это однослотовое, полнопрофильное решение для инференса тяжелых моделей ИИ с увеличенным объемом памяти, представленное в 2022 году. Atlas 300i Duo оснащен двумя ИИ-чипами Ascend 310P с суммарным количеством ядер в 16 штук, объем памяти увеличен до 96 ГБ LPDDR4X, а также доступна упрощенная конфигурация с 48 ГБ VRAM. Колоссальный объем памяти в 96 ГБ необходим для возможности развертывания больших языковых моделей с полным числом параметров без применения квантизации, благодаря чему даже в современных реалиях Atlas 300i Duo выглядит вполне конкурентоспособно в сравнении с ускорителями Nvidia H100 и A100. Несмотря на это, стоимость Atlas 300i Duo кратно ниже, чем цены на решения конкурентов, поскольку ускоритель от Huawei оптимизирован только для инференса LLM. Устройство демонстрирует ИИ-производительность до 280 TOPS (INT8) и 140 TFLOPS (FP16), поддерживает гибридные вычисления для задач компьютерного зрения, NLP и видеоаналитики, включая обработку 256 каналов HD-видео (1080p) в режиме реального времени с аппаратным кодированием/декодированием H.265/JPEG. Интеграция с экосистемой Huawei, включая систему Mind Studio и репозитории TensorFlow, PyTorch и ONNX упрощает развертывание языковых моделей в гибридных средах. Основные сценарии использования Atlas 300i Duo включают облачный инференс LLM, умные системы видеонаблюдения, IoT, автономный транспорт и системы безопасности, требующие обработки данных с низкой задержкой и высокой пропускной способностью памяти. Коэффициент энергоэффективности решения составляет 1,86 TOPS на 1 Вт. Используя 6 ускорителей Atlas 300i Duo, вы можете собрать высокопроизводительную и при этом энергоэффективную систему с огромным объемом VRAM для развертывания передовых языковых моделей, таких как DeepSeek R1 671b и llama* 4. На самом деле, Atlas 300i Duo стала по-настоящему народным ИИ-ускорителем в Китае и ее регулярно можно увидеть в обзорах по развертыванию отечественных LLM.

Huawei Atlas 300i Duo
Поскольку Huawei Atlas 300i Duo является стандартной, однослотовой платой расширений, для ее питания используется разъем 8-pin. Также на рендере видно, что решение имеет два интегрированных процессора Ascend 310P. Источник: Baidu.

Характеристика

Huawei Atlas 300i Duo

Дата-выхода

2022 год

Форм-фактор

Однослотовая карта

ИИ-Процессор

2x Ascend 310P, 16 ядер с частотой 1,9 ГГц

Формат памяти

до 96 ГБ LPDDR4X ECC

Общая пропускная способность

408 ГБ/с

Поддерживаемые кодеки

H.264, H.265

Интерфейс

PCIe x16 Gen4.0

INT8

280 TOPS

FP16

140 TFLOPS

TDP

150 Вт


Huawei Atlas 300I A2

Huawei Atlas 300I A2 — это новейшая низкопрофильная карта линейки Atlas 300I, первые упоминания которой появились в январе 2025 года. По всей видимости, это решение является наиболее производительной PCIe картой линейки Atlas 300I, близкое по производительности к решениям Atlas 300T. На сайте Huawei не представлено подробной информации об этих решениях, однако, на сайте компании Quanaichina, которая является дочерней организацией Huawei, указаны некоторые данные о Atlas 300I A2. По всей видимости, новое решение будет предназначено именно для обучения моделей искусственного интеллекта, а не инференса, что нехарактерно для линейки Atlas 300I. Ввиду этого, можно предположить, что Atlas 300I A2 будут иметь память формата HBM и увеличенную производительность в режимах FP16 и INT8. Также известно, что PCIе карта будет иметь двухслотовый форм-фактор, в ней будет использоваться процессор Ascend 310P, а ее TDP будет достигать 350 Вт. Кроме того, максимальное поддерживаемое разрешение Atlas 300I A2 для статичных изображений достигает 16384 x 16384, а для видеоматериалов — 8192 x 8192. Также поддерживается декодирования JPEG в 1080p/12288 FPS, благодаря чему Atlas 300I A2 будут идеальным решением для интеграции в систем видеонаблюдения для распознавания лиц, таких как “умный город”, которые особенно актуальны в Китае ввиду огромного объема населения. 

Huawei Atlas 300i A2
Новейшие видеокарты линейки Huawei Atlas 300I A2. Источник: Quanaichina.

Huawei Atlas 300V

Huawei Atlas 300V — компактная PCIe карта 2022 года выпуска, которая предназначена для эффективной обработки видеопотоков, а также поддерживает различный ИИ-функционал благодаря наличию ИИ-процессора. По сути, карта расширений Huawei Atlas 300V является полным аналогом Atlas 300I Pro, оптимизированным не для инференса ИИ, а для работы с видео и изображениями. По всей видимости, компания Huawei имеет в своем арсенале технологии, которые позволяют удобно менять соотношение ИИ-блоков и блоков обработки видео, от которого и будет зависеть дальнейшая спецификация решений. Ввиду этого Atlas 300V повторяет практически все характеристики оригинальной карты, однако, ИИ-производительность решения, очевидно, снижена ввиду пониженных требований, а количество каналов обработки видео в разрешении 1080p/25FPS расширено до 100. Также поддерживается функция декодирования JPEG 4K 384FPS, а максимальное доступное разрешение — 8192 x 8192. Области применения PCIe карт Huawei Atlas 300V весьма ограничены — данные решения можно эффективно применять в системах умного видеонаблюдения и системах “умный город 2.0”, что обуславливается поддержкой огромного количества видеопотоков.

Huawei Atlas 300V
PCIe карта Huawei Atlas 300V для анализа видеопотока с прозрачной крышкой, через которую видно материнскую плату и процессор устройства. Источник: Baidu.

Характеристика

Huawei Atlas 300V

Дата-выхода

2022 год

Форм-фактор

Низкопрофильная карта расширений

ИИ-Процессор

1x Ascend 310P, 8 ядер

Формат памяти

24 ГБ LPDDR4X ECC

Общая пропускная способность

204,8 ГБ/с

Поддерживаемые кодеки

H.264, H.265

Интерфейс

PCIe x16 Gen4.0

INT8

100 TOPS

FP16

50 TFLOPS

TDP

72 Вт


Huawei Atlas 300V Pro

Huawei Atlas 300V Pro — усовершенствованная плата расширений для видеоанализа Atlas 300V, которая имеет увеличенный объем видеопамяти, улучшенную ИИ-производительность, а также поддерживает обработку до 128 видеопотоков в разрешении 1080p/25FPS в режиме реального времени. Примечательно, что при двукратном увеличении объема видеопамяти, Huawei оставили пропускную способность на уровне 204,8 ГБ/с — возможно, это было сделано во избежание роста тепловыделения, так как он остался на уровне Atlas 300V. В отличие от предыдущей версии карты расширений для обработки видеопотоков, решение Atlas 300V Pro имеет более широкий пул сценариев использования, например, в системах умных финансов, автоматизированного распознавания транспорта, обеспечения безопасности в городской среде и парковых зонах и так далее. Именно для поддержки продвинутых ИИ-функций, таких как распознавание лиц, фиксирование автомобильных номеров, нахождение объектов и распознавание движений, Atlas 300V Pro имеют производительность до 70 TFLOPS в режиме FP16.

Huawei Atlas 300V Pro
Рендер PCIe карты Huawei Atlas 300V Pro для анализа видеопотока в разобранном виде. На изображении также показан NPU-чип Ascend 310P. Источник: Huawei.

Характеристика

Huawei Atlas 300V

Дата-выхода

2021 год

Форм-фактор

Низкопрофильная карта расширений

ИИ-Процессор

1x Ascend 310P, 8 ядер

Формат памяти

48 ГБ LPDDR4X ECC

Общая пропускная способность

204,8 ГБ/с

Поддерживаемые кодеки

H.264, H.265

Интерфейс

PCIe x16 Gen4.0

INT8

140 TOPS

FP16

70 TFLOPS

TDP

72 Вт


Huawei Atlas 300T

Huawei Atlas 300T — это особое ИИ-решение линейки Atlas, которое оптимизировано не для инференса языковых моделей, а для их обучения. Atlas 300T недоступны для отдельной покупки и поставляются только в составе высокопроизводительных серверов для дата-центров корпоративного уровня. В отличие от ускорителей для инференса LLM, Atlas 300T имеет колоссальный уровень производительности до 256 TFLOPS в режиме FP16, что обуславливается интеграцией особого чипа Ascend 910, который состоит, предположительно, из тензорных ядер NPU и вычислительных ядер TaiShan. Поскольку процессор Ascend 910 является самым первым представителем семейства чипов Ascend, в котором Huawei лишь тестировала новые технологии, точное соотношение NPU и CPU ядер неизвестно. Для достижения наиболее эффективного обучения искусственного интеллекта, в решения Atlas 300T интегрирована гибридная память — 32 ГБ HBM и 16 ГБ DDR4, последняя нужна для выполнения вспомогательных задач. Такая конфигурация ядер и памяти объясняется тем, что Ascend 910 изначально предполагался как NPU-процессор, но впоследствии в него интегрировали HBM-память, сделав из него гибрид NPU и GPU.Примечательно, что Huawei Atlas 300T, по сути является первым представителем линейки ИИ-ускорителей Huawei Ascend 910, поскольку последующие поколения этого семейства базируются в корпусе Atlas 300T — в них меняется лишь гибридный чип Ascend. Так как ускорители Atlas 300T позиционируются как решения корпоративного уровня для работы в высокопроизводительных вычислительных кластерах Atlas 900, они имеют сетевой интерфейс 100GE QSFP-DD и поддержкой технологии RoCE. Такой же подход к интеграции сетевых возможностей в ИИ-решений можно встретить в конвергентных ускорителях Nvidia A100X, в которые представляют собой гибрид DPU и GPU. Ввиду двухслотовой конфигурации, карта Huawei Atlas 300T имеет разъем питания 8-pin.

Huawei Atlas 300T
PCI-e карта Huawei Atlas 300T в разобранном виде. Как видно на рендере, на материнской плате ускорителя расположен графический процессор Ascend 910 с HBM-памятью, вокруг которого располагаются чипы памяти DDR4. Источник: Huawei.

Характеристика

Huawei Atlas 300T

Дата-выхода

2022 год

Форм-фактор

Двухслотовая карта расширений

ИИ-Процессор

Ascend 910

Формат памяти

32 ГБ HBM, 16 ГБ DDR4 ECC

Общая пропускная способность

800 ГБ/с

Поддерживаемые кодеки

H.264, H.265

Интерфейс

PCIe x16 Gen4.0

Сетевые возможности

1x порт 100GE QSFP-DD

INT8

-

FP16

256 TFLOPS

TDP

300 Вт


Huawei Atlas 300T A2

Huawei Atlas 300T A2 — это улучшенная конфигурация ускорителя Atlas 300T, которая имеет увеличенные показатели ИИ-производительности, до 2 портов 200GE RoCE v2. В сети практически нет информации о картах расширений Atlas 300T A2, поскольку эти решения пока что не были выпущены компанией Huawei. Также известно, что чипы Atlas 300T A2 поддерживают передовые центральные процессоры Kunpeng 920 с 48 ядрами. Судя по информации, полученной из китайских форумов, Atlas 300T A2 имеет гибридный процессор следующего поколения Ascend 910B, который позднее использовался в одноименных ИИ-ускорителях для обучения ИИ. Стоит отметить, что в отличие от своего предшественника, Atlas 300T A2 поддерживает более современный формат сверхбыстрой памяти HBM2. В данный момент ускорители обучения LLM Atlas 300T A2 еще даже не были анонсированы, однако, на китайских сайтах можно найти ряд сливов, указывающих на анонс новейших ИИ-решений уже в мае 2025 года.

Huawei Atlas 300T A2
PCI-e плата расширений для обучения ИИ Huawei Atlas 300T A2. Источник: Baidu.

Характеристика

Huawei Atlas 300T A2

Дата-выхода

-

Форм-фактор

Двухслотовая карта расширений

ИИ-Процессор

Ascend 910B, 46 ядер частотой 2,2 ГГц

Формат памяти

64 ГБ HBM2, 16 ГБ DDR4 ECC

Общая пропускная способность

800 ГБ/с 

Поддерживаемые кодеки

H.264, H.265

Интерфейс

PCIe x16 Gen5.0

Сетевые возможности

2x порта 200GE RoCE v2

INT8

280 TOPS

FP16

280 TFLOPS

FP32

75 TFLOPS

TDP

330 Вт


Ускорители обучения ИИ Huawei Ascend

Ускорители для обучения ИИ линейки Ascend представляют собой флагманские, высокопроизводительные решения компании Huawei, созданные для конкуренции с топовыми чипами Nvidia. Если первые решения линейки Ascend, такие как модели ускорителей Ascend 910 представляли собой сырое, недоработанное решение с массой недостатков, то новейшие устройства вроде Ascend 910C и 920 вполне способны эффективно конкурировать с западными ИИ-ускорителями, например, H100 и H20.

Сравнение чипов Huawei Atlas и Huawei Ascend
Сравнение размеров чипов для ИИ-решений Huawei Atlas и Huawei Ascend. Огромной разницей в габаритах процессоров и обуславливается значительный прирост производительности между Ascend 310 и Ascend 910. Источник: Baidu.

В основе их архитектуры лежит использование памяти HBM, что обеспечивает исключительную пропускную способность до 3.2 ТБ/с, а вычислительная мощность достигает 800 TFLOPS в операциях с FP16, что составляет около 80% от возможностей H100. Кроме того, ИИ-ускорители Ascend также базируются на одноименных NPU-чипах на собственной архитектуре Da Vinci, которая также применяется в разработке PCIe плат для инференса ИИ Atlas. ИИ-ускорители Ascend не выпускаются в формате PCI-E, а интегрируются в специализированные серверные системы, например, в серверы Huawei Atlas 800. Последние представляют собой масштабируемые платформы, объединяющие до 32 ускорителей в рамках единого кластера, что позволяет обрабатывать сложные задачи обучения нейросетей и инференса. Важно отметить, что структура проектирования ускорителей Ascend очень напоминает ИИ-решения Nvidia, причем, как по внешнему виду, так и по способу масштабирования — старшие чипы представляют собой несколько младших чипа, соединенных между собой интерконнектом.

Huawei Atlas 800 Training
Сервер Huawei Atlas 800 Training, в которые интегрируются ИИ-ускорители линейки Ascend. Источник: Huawei.

Серверные стойки, такие как Huawei CloudMatrix 384, также демонстрируют системный подход компании к масштабированию ИИ-инфраструктуры. Эти решения аналогичны Nvidia NVL72 и объединяют до 384 ускорителей Ascend 910C с оптическими соединениями. Для эффективной работы ускорителей, в серверы и кластеры Huawei интегрируются с центральные процессоры Huawei Kunpeng, благодаря чему компании удается создать полностью обособленную экосистему, оптимизированную под задачи машинного обучения. Например, кластеры CloudMatrix 384 распределены по 16 стойкам, где каждая содержит 32 GPU, связанных через высокоскоростные оптические интерфейсы, минимизирующие задержки. Несмотря на более высокое энергопотребление (в 3.9 раза выше, чем у GB200 NVL72), такие системы идеально подходят для рынка Китая, где доступ к дешевой энергии и государственная поддержка ИИ-инфраструктуры компенсируют все недостатки. При этом, Huawei активно развивает программную экосистему, чтобы преодолеть разрыв производительности в сравнении с решениями на архитектуре CUDA, пытаясь полностью импортозаместить западные ИИ-технологии.

Huawei Atlas 900 AI PoD
Серверный кластер Huawei Atlas 900 AI PoD. Источник: Huawei.

Huawei Ascend 910B

Huawei Ascend 910B — это первые успешные ИИ-ускорители для обучения LLM от Huawei, представленные в 2022 году, которые позиционировались как аналог ускорителей Nvidia A100. Основой ускорителя является одноименный чип Ascend 910B, который производится по техпроцессу 7-нм SMIC (N+1) на усовершенствованной архитектуре New DaVinci, которые, по сравнению с предыдущей версией Ascend 910, предлагают большую энергоэффективность и поддержку современных форматов вычислений, таких как FP16 и INT8. Несмотря на использование менее продвинутого техпроцесса SMIC по сравнению с TSMC (из-за санкций США), Huawei удалось достичь значительного прогресса в увеличении производительности по сравнению с ускорителями Huawei 910, хотя увеличение размера кристалла (до 665.61 мм²) указывает на компромиссы в плотности транзисторов. Помимо этого, в решениях Ascend 910B используется высокоскоростная память формата HBM2 объемом 32 ГБ, что обеспечивает значительный прирост эффективности при обучении нейросетей. 

Гибридный процессор Ascend 910B
Гибридный процессор Ascend 910B, который используется в одноименных ИИ-ускорителях. Источник: Baidu.

Характеристика

Huawei Ascend 910B

Дата выхода

2022 год

ИИ-Процессор

25 ядер New DaVinci

Формат памяти

HBM2 32 ГБ

Общая пропускная способность

800 ГБ/с

Интерфейс

PCIe 4.0

INT8

640 TOPS

FP16

320 TFLOPS

TDP

310 Вт


Huawei Ascend 910C

Huawei Ascend 910C — передовые ИИ-ускорители, благодаря которым весь мир узнал, что китайская микропроцессорная промышленность может соперничать с передовыми решениями Nvidia. Huawei Ascend 910C, анонсированные в 2024 году, представляет собой два чипа Ascend 910B на 7-нм техпроцессе SMIC, объединенных на одной подложке. Компания Huawei заявляет, что им удалось добиться показателя производительности, которые составляет 60% от ИИ-эффективности решений Nvidia H100. Huawei Ascend 910C все еще не вышли в продажу и о них мало что известно, так как решения предназначены исключительно для местного рынка, однако, первые отгрузки устройств начнутся уже в мае 2025 года и к тому времени можно ожидать появления первых обзоров и подобных характеристик. 

Huawei Ascend 910C
ИИ-ускоритель для обучения искусственного интеллекта Huawei Ascend 910C, предположительно, будет состоять из корпуса PCIe карты Huawei Atlas 300T нового поколения и гибридного чипа Ascend 910C, подобно структуре своего предшественника в лице Ascend 910B. Источник: Baidu.

Huawei Ascend 920

Huawei Ascend 920 — это новейшие ИИ-решения Huawei, анонсированные в 2025 году и призванные заменить ускорители Nvidia H20 после ввода торговых ограничений со стороны США. О характеристиках ускорителей Ascend 920 в данный момент практически ничего неизвестно, однако, пользователи предполагают, что производительность решений в режиме FP16 достигнет колоссальных 900 TFLOPS, память обновится до формата HBM3, пропускная способность увеличится до 4 ТБ/с, а сами чипы будут производиться по передовому техпроцессу SMIC 6-нм. Кроме того, модификация 920C, предназначенная для обучения моделей с архитектурой Transformer и Mixture of Experts, по сообщениям инсайдеров, превысит производительность стандартного Ascend 920 примерно на 30–40%. Если упомянутые характеристики подтвердятся, то ускорители Ascend 920 могут действительно стать заменой не только решений H20, но и полноценных ускорителей Nvidia H100, полностью вытеснив западные компании с китайского рынка. Предполагается, что полноценного выхода Huawei Ascend 920 стоит ждать не раньше второй половины 2025 года. 


Huawei Ascend 910 и Nvidia GH100
Процессоры для ИИ-ускорителей Huawei Ascend 910 и Nvidia GH100 имеют практически идентичную архитектуру кристалла чипа. 

Что же выбрать?

Выбор ИИ-решения от Huawei зависит исключительно от потребностей вашего бизнеса, причем, подобрать наиболее подходящую PCI-e карту или ИИ-ускоритель будет очень удобно благодаря классификации семейств устройств. Если вы хотите приобрести компактное решение с высокой производительностью для инференса языковых моделей, то вам идеально подойдут устройства Atlas 300i. Для обучения более продвинутых LLM и их интеграции в бизнес-приложения могут отлично послужить решения Atlas 300T с высочайшей производительностью и наличием HBM-памяти. В свою очередь, в целях возведения полномасштабных дата-центров для разработки новейших моделей искусственного интеллекта идеальным вариантом станут решения семейства Ascend, которые практически ничем не уступают ИИ-ускорителям от Nvidia при кратно меньшей стоимости. 

Вывод

Очевидно, что за последние несколько лет Китай превратился из сильно отстающей в отрасли микропроцессорной промышленности страны в законодателя мод индустрии искусственного интеллекта. А с учетом череды внезапных анонсов ускорителей Ascend 910C и 920, можно с уверенностью заявить, что Китай уже практически вплотную подобрался к уровню производительности, который предлагает компания Nvidia. Если новейшие решения Ascend 910C и 920 после своего выхода действительно предложат производительность и характеристики, которые от них ожидает все мировое сообщество, то Китай не просто выровняется, но и обойдет США в технологической гонке, став мировым лидером в сфере IT-промышленности.
Автор: Serverflow Serverflow
Поделиться

Комментарии 0

Написать комментарий
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Написать отзыв
До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Написать комментарий

Комментарий появится на сайте после предварительной модерации

До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Мы свяжемся с вами утром

График работы: Пн-Пт 10:00-19:00 (по МСК)

Обработаем вашу заявку
в ближайший рабочий день

График работы: Пн-Пт 10:00-19:00 (по МСК)