Top.Mail.Ru
Процессоры из Поднебесной: Shenwei (Sunway) — Суперкомпьютерный RISC на ShenWei-64 | Блог Serverflow Скачать
прайс-лист
Бесплатная
доставка по РФ
Distribution of
Server Components
8 (800) 222-70-01 Консультация IT-специалиста Сравнение

Процессоры из Поднебесной: Shenwei (Sunway) — Суперкомпьютерный RISC на ShenWei-64

~ 15 мин
316
Простой
Статьи
Процессоры из Поднебесной: Shenwei (Sunway) — Суперкомпьютерный RISC на ShenWei-64
Содержание:

Введение

Китай является страной с одной из самых сильных армий в мире, поэтому очевидно, что в стране разрабатывают процессоры, ориентированные на использование исключительно в оборонной индустрии. Однако, удивительно что одно из таких “военных” семейств процессоров вышло за рамки своего изначального предназначения и стало использоваться в суперкомпьютерах и ПК. Название этих процессоров — Shenwei (Sunway). В этой статье мы расскажем вам, что из себя представляют эти процессоры, какую архитектуру они используют, какие серии чипов Shenwei существуют, а также перечислим устройства на базе этих CPU.

История появления компании Shenwei

Поскольку Shenwei изначально разрабатывались для военных нужд, в сети не найти подробной информации об этих процессорах. Известно, что созданием Shenwei занимается лаборатория Цзяннань в городе Уси (Jiāngnan Computing Lab) и дочерняя компания China Telecom Shentai Information Technology Co., Ltd. Спонсированием проекта занимался китайский национальный фонд “Nuclear High Foundation” и главной целью разработчиков было выпустить многоядерный высокопроизводительный процессор для военной промышленности с полностью независимыми правами на интеллектуальную собственность. 

Лаборатория Цзяннань в Уси, Китай
Лаборатория Цзяннань, которая занимается выпуском процессоров семейства Shenwei. Источник: Baidu.

В результате усилий лаборатории Цзяннань в 2006 году появился дебютный чип SW-1 на архитектуре Alpha. На тот момент это решение вполне можно было назвать передовым для микропроцессорной индустрии, несмотря на то, что SW-1 был одноядерным и имел тактовую частоту 900 МГц на техпроцессе 130-нм SMIC. Правительство КНР по достоинству оценило эту разработку и фонд продолжил спонсировать разработчиков, в результате чего спустя 2 года был выпущен SW-2, который уже имел 2 ядра, частоту 1400 МГц, расходовал 70-100 Вт, но был построен на том же техпроцессе 130-нм SMIC. На данный момент существует 4 чипа Sunway, наиболее современным из которых является процессор SW26010, который был выпущен в 2016-ом году и применялся в суперкомпьютере Sunway TaihuLight, который до 2018-ого года являлся самым производительным суперкомпьютером в мире.

Архитектура чипов

Первое поколение процессоров Sunway было создана на базе микропроцессора DEC Alpha 21164 с архитектурой Alpha с набором инструкций RISC. Alpha 21164, произведенный компанией Digital Equipment Corporation в 1994 году, представлял собой микропроцессор с 4 исполнительными блоками частотой 300 МГц, способный выполнять максимум 4 инструкции за такт, имел 4 исполнительных блока: 2 для целочисленных вычислений и 2 для вычислений с плавающей запятой. Alpha 21164 сохранял лидерство по производительности среди микропроцессоров до 1995 года, уступив Intel Pentium Pro. Неизвестно, почему Китай взял за основу именно процессор DEC Alpha 21164 — скорее всего, это связано с тем, что архитектура Alpha к 2006 году стала независимой, поэтому разработчикам не требовалось покупать лицензию на разработку SW-1 и последующих моделей чипов. 

Процессор DEC Alpha 21164
Процессор DEC Alpha 21164, на базе которого создавались первые чипы Shenwei. Источник: Baidu.

Архитектура Alpha использовалась для создания процессоров Shenwei вплоть до модели SW-3 (SW1600), которая вышла в 2010 году, однако, точная архитектура чипа SW-3 до сих пор неизвестна. Для выпуска передового чипа SW26010, разработчики решили перейти на новую, совершенно новую архитектуру собственной разработки — ShenWei-64, совместимую с набором команд RISC. Об этой архитектуре известно очень мало, так как Китай не разглашает подробной информации о ShenWei-64. Скорее всего, страна боится копирования или кражи технологии производства чипов Sunway, так как процессоры на базе этой архитектуре применялись для создания некогда мощнейшего суперкомпьютера в мире. Сообщество предполагает, что ShenWei-64 использует сокращенный набор команд RISC, однако, Jiāngnan Computing Lab утверждает, что их собственная архитектура использует уникальный набор команд, созданный китайскими разработчиками.

Материнская плата на базе процессоров Sunway
Интересно, что на материнских платах на базе процессоров Sunway, оперативная память распаивается на одной плате вместе с CPU, что является нестандартным решением для сектора HPC. Источник: Baidu.

Shenwei SW26010 Pro

Shenwei SW26010 Pro — это наиболее современная модель процессоров семейства чипов Sunway, который вышел в 2021 году и имеет огромное количество ядер, достигающее 384 штуки. Как и чип прошлого поколения SW26010, процессор SW26010 Pro построен на базе архитектуры ShenWei-64. Изначально этот процессор был засекречен китайскими властями, однако, в конце 2023 года Китай все-таки поделился подробностями о SW26010 Pro и о суперкомпьютере Ocean Light, который создан на основе этих CPU. В отличие от своего предшественника, усовершенствованный чип SW26010 Pro демонстрирует большую производительность в вычислениях FP64 и FP32, которая достигает 13,8 TFLOPS и 27,6 TFLOPS соответственно, что является огромным показателем не только для китайского сектора HPC, но и для всей индустрии в целом. Кроме того, чип способен выполнять до 16 инструкций за 1 такт, что в 4 раза превышает количество исполняемых инструкций чипом SW26010. 

Схема передового китайского CPU SW26010 Pro
Схема процессора SW26010 Pro. Источник: Baidu.

Процессор Shenwei SW26010 Pro состоит из 6 кластеров ядер, а также имеет дополнительные блоки обработки протоколов (PPU). Каждый кластер имеет 64 вычислительно-процессорных элемента и 512-битный векторный движок, 1 блок MPE, а также увеличенный объем кэш-памяти, достигающий 256 КБ, что в 4 раза больше, чем у SW26010. Однако, объем кэш-памяти для выполнения инструкций не изменился и также составляет 16 КБ. В свою очередь, суперскалярный блок мониторинга и управления MPE также получил увеличенную кэш-память —32 КБ кэша для инструкций и столько же кэша L1, 256 КБ кэша L2. О прорывном китайском суперкомпьютере Ocean Light известно не так много, но известно, что он состоит из 49 230 узлов и имеет производительность более 1 EFLOPS.

Суперкомпьютер Ocean Light на базе Shenwei SW26010 Pro
Передовой китайский суперкомпьютер Ocean Light на базе Shenwei SW26010 Pro. Источник: Baidu.

Подробной информации о характеристиках чипов Sunway SW26010 Pro, к сожалению, нет, однако, Китай поделился следующими данными о своих передовых процессорах:

Характеристика

SW26010 Pro

Архитектура

ShenWei-64

Техпроцесс

12-нм

Сокет

BGA

Кол-во ядер

390 ядер

Тактовая частота

2,25 ГГц

Контроллер памяти

12-канальный DDR4-3200

Пропускная способность памяти

307,2 ГБ/с

Объем памяти

96 ГБ ECC

Shenwei SW26010

Shenwei SW26010 — это 260-ядерный китайский процессор для сектора HPC последнего поколения, выпущенный в 2016 году. Чип SW26010 имеет производительность до 3062 GFLOPS и состоит из 4 кластеров, каждый из которых включает 64 вычислительно-процессорных элемента (CPE). В отличие от прошлых процессоров семейства Sunway, в передовом чипа SW26010 впервые была задействована полностью независимая RISC-совместимая архитектура ShenWei-64, разработанная в Китае. Каждый CPE исполняет до 8 SIMD-инструкций в целочисленных операциях, а каждый вычислительный кластер оснащен одним дополнительным ядром, которое исполняет функции мониторинга и управления – такие ядра называются MPE. Кроме того, каждый кластер включает в себя собственный контроллер памяти  DDR3 SDRAM, а также банк памяти с собственным адресным пространством. Также все вычислительно-процессорные элементы имеют внутренний кэш объемом 64 КБ для данных и 16 КБ для выполнения инструкций, кэш-памяти соединена между всеми CPE с помощью сети-на-кристалле (NoC), а традиционная иерархия кэш-памяти в них не используется. Однако, для MPE применяется традиционный кэш с 32 КБ L1 для данных и инструкций и 256 КБ L2. Несмотря на то, что Sunway SW26010 не поддерживает аналоги технологий Hyper-Threading и Turbo Boost, эти недостатки компенсируются колоссальным количеством ядер, которое достигается особой технологией Deeply Fused Many-Core (DFMC).

Процессор Shenwei SW26010
Процессор для суперкомпьютеров Shenwei SW26010. Источник: Baidu.

Такая сложная система была необходима для интеграции процессоров Sunway SW26010 в передовые китайские суперкомпьютеры Sunway TaihuLight, который с 2016 по 2018 год занимал 1 место в рейтинге мощнейших суперкомпьютеров TOP500. Вот какие характеристики имел суперкомпьютер Sunway TaihuLight:

  • Кол-во процессоров — 40960 шт. SW26010;
  • Кол-во вычислительных узлов — 256;
  • Оперативная память — 1,3 ПБ;
  • Пиковая производительность — 93,01 PFLOPS;
  • Общее энергопотребление — 15,3 МВт.
Суперкомпьютер Sunway TaihuLight на базе Shenwei SW26010
Китайский суперкомпьютер Sunway TaihuLight, занявший 1 место в рейтинге самых производительных HPC TOP500 в 2016 году. Источник: Baidu.

Несмотря на то, что Китай не разглашал подробности о чипах Shenwei SW26010, в сети все-таки доступна часть информации о характеристиках этих передовых процессоров:

Характеристика

SW26010

Архитектура

ShenWei-64

Сокет

BGA

Кол-во ядер

260 ядер

Тактовая частота

1,45 ГГц

Контроллер памяти

4-канальный DDR3-2133

Пропускная способность памяти

136 ГБ/с

Объем памяти

32 ГБ ECC

Shenwei SW1600

Shenwei SW1600 (или SW-3) — это модель третьего поколения процессоров Sunway, выпущенная в 2010 году и предназначенная для интеграции в суперкомпьютеры. SW1600 представляет собой суперскалярный 16-ядерный чип с частотой до 1,2 ГГц. Китайские власти не делились информацией об архитектуре процессора SW1600, называя ее “автономным набором команд”, однако, пользователи китайских форумов считают, что чип создан на базе Alpha. Как и прошлые поколения процессоров Sunway, чип SW1600 имеет 2 целочисленных вычислительных модуля с 7-этапным конвейером и 2 модуля вычислений с плавающей запятой с 10-этапным конвейером, благодаря чему процессор имеет производительность 140,8 GFLOPS при тактовой частоте 1,2 ГГц. Также SW1600 поддерживает до 8 ТБ виртуальной памяти. Однако, чип Shenwei SW1600 имеет весьма небольшой объем кэш-памяти — всего 96 КБ кэша L2 без поддержки кэша L3. В сети нет информации о наличии аналогов Hyper-Threading и Turbo Boost, поэтому можно предположить, что чипы Shenwei SW1600 не поддерживают таких технологий, как и многие другие китайские CPU.

Процессор Shenwei SW1600
Китайский процессор Shenwei SW1600. Источник: Baidu.

Процессор Shenwei SW1600 использовался в первом публично анонсированном китайском суперкомпьютере Sunway BlueLight, который был выпущен в 2011 году, заняв 2 место в рейтинге китайских суперкомпьютеров и на 14 место в рейтинге TOP500. Суперкомпьютер Sunway BlueLight состоял из 9 стоек с 8704 процессорами ShenWei SW1600 и имел следующие характеристики:

  • Кол-во процессоров — 8575 шт. SW1600;
  • Кол-во вычислительных узлов — 256;
  • Оперативная память — 150 ТБ;
  • Пиковая производительность — 1.07016 PFLOPS;
  • Общее энергопотребление — 1074 кВт.
Суперкомпьютер Sunway BlueLight на базе Sunway SW1600
Суперкомпьютер Sunway BlueLight на базе процессоров Sunway SW1600. Источник: Baidu.

Предоставляем таблицу с подробными характеристиками китайского процессора Shenwei SW1600:

Характеристика

Shenwei SW1600

Архитектура

предположительно Alpha

Техпроцесс

65-нм SMIC

Сокет

BGA

Кол-во ядер

16 ядер

Тактовая частота

1,2 ГГц

Контроллер памяти 

4-канальный DDR3-1066

Пропускная способность памяти

до 68 ГБ/с

Объем памяти

16 ГБ ECC

TDP

35-70 Вт

Устройства на базе Shenwei

Поскольку серверные процессоры семейства Shenwei предназначены для использования в секторе HPC, на рынке не представлено пользовательских решений на базе этих CPU. На китайских форумах часто можно встретить людей, которые считают, что в будущем на базе процессоров Sunway будут представлены решения для массового рынка, например, ноутбуки или ПК. Однако, такой исход маловероятен, так как Jiāngnan Computing Lab всю свою историю производила чипы для государственных инфраструктур, в том числе и для оборонных систем. 

Прототип материнской платы на базе процессора SW1621
Прототип материнской платы на базе процессора SW1621, которая применялась для создания суперкомпьютера Sunway BlueLight. В отличие от более поздних версий материнских плат на базе SW1621, в этом прототипе оперативная память имеет форм-фактор DIMM. Источник: Baidu

Помимо серверных процессоров для сектора HPC, существуют чипы корпоративного сегманта Sunway, о которых известно не так много, но их используют при создании серверов для дата-центров. Ярким примеров таких решений является сервер Jite GDC-2000 на базе двух 16-ядерных процессоров Shenwei 3231. Этот сервер поддерживает 32 слота DDR4 общим объемом в 4 ТБ и имеет пиковую пропускную способность, достигающую 168,75 Гбайт/с. Также у этого сервера Jite GDC-2000 есть упрощенная версия на базе процессоров SW1621 — сервер YSI-2102 с упрощенным контроллером памяти и более низкой тактовой частотой ядер. Интересно, что многие китайские компании выпускают собственные сервера с процессорами семейства Sunway, устанавливая их в разные корпуса и давая им разные названия, поэтому найти решение на базе чипов Sunway не так просто. 

Китайский сервер на базе Shenwei 3231
Двухсокетный сервер на базе десктопных процессоров Shenwei 3231. Источник: Baidu.

Поддерживаемые ОС

Sunway Raise OS — это операционная система на базе Linux, разработанная специально для применения в суперкомпьютере Sunway TaihuLight на базе чипов Shenwei SW26010. Sunway Raise OS оптимизирована для выполнения задач сектора HPC, имеет встроенные софты для обеспечения более эффективного управления ресурсами системы, совместима с широким списком приложений и инструментов, а также способна стабильно функционировать даже при длительной эксплуатации суперкомпьютера. Но на процессорах Sunway можно запускать и другие китайские операционные системы на базе Linux, например, Tencent OS, Kirin, NeoKylin, а также ОС для китайских CPU, вроде Unity OS (Zhaoxin), Loongix (Loongson). Помимо этого, на процессорах Sunway можно запускать международные дистрибутивы Linux, вроде Debian, Red Hat и Ubuntu.

Запуск Unity OS на Shenwei SW1600
Запуск китайской операционной системы Unity OS на процессорах Shenwei SW1600. Источник: Baidu.

Процессоры Shenwei также поддерживают такой инструмент, как Sunway OpenACC, который является специальным параллельным компилятором на базе синтаксиса OpenACC 2.0. Благодаря этому компилятору, на системах с процессорами Sunway можно запускать различное программное обеспечение, предназначенное для процессоров на базе таких архитектур, как ARM или x86. Кроме того, чипы семейства Shenwei имеют базовый программный стек, который включает в себя дополнительные компиляторы и инструменты, например,  компиляторы C/C++ и Fortran, софт для автоматической векторизации и стандартные математические библиотеки.

Заключение

Чипы семейства Shenwei являются наглядным доказательством того, что Китай, несмотря на все санкции со стороны США, продолжает наращивать свою мощь в сфере микропроцессорной индустрии и выпускает передовые решения, которые без труда конкурируют с западными аналогами в лице AMD и Intel. На базе Shenwei создавались и продолжают создаваться суперкомпьютеры, которые занимают первые позиции в рейтинге TOP500, что говорит об огромном потенциале страны в секторе HPC. С учетом того, что процессоры Sunway изначально создавались для военных нужд и долгое время были секретной разработкой, не исключено, что в этом семействе CPU есть и другие представители, о которых Китай предпочитает умалчивать, но их число ядер и производительность способна побить все рекорды индустрии.
Автор: Serverflow Serverflow
Поделиться

Комментарии 0

Написать комментарий
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Написать отзыв
До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Написать комментарий

Комментарий появится на сайте после предварительной модерации

До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Мы свяжемся с вами утром

График работы: Пн-Пт 10:00-19:00 (по МСК)

Обработаем вашу заявку
в ближайший рабочий день

График работы: Пн-Пт 10:00-19:00 (по МСК)