В статье про графические процессоры от Jingjia Micro мы рассказали вам, что китайская компания поставила себе очень амбициозные цели и попыталась конкурировать с таким гигантом, как Nvidia, однако, их планы ограничились только громкими заявлениями. Но китайский сектор GPU не ограничивается только одной компанией и на местном рынке есть еще один игрок, которому удалось максимально приблизиться по производительности к своим западным конкурентам — Moore Threads. В этой статье мы расскажем вам, как появилась Moore Threads, в чем заключаются особенности их графических процессоров, какие решения на базе их GPU представлены на рынке и насколько видеокарты китайской компании конкурентоспособны на фоне видеокарт от Nvidia и AMD.
Графический процессор Moore Threads SD102AA внешним видом очень напоминает микропроцессоры от Nvidia. Источник: Forum.ixbt.pro.
О компании Moore Threads
Компания Moore Threads была основана в 2020 году в городе Пекин опытным специалистом в области GPU Чжаном Цзиньсюном, который ранее занимал должность глобального вице-президента Nvidia и генерального директора Nvidia в Китае. Точные причины ухода Чжана Цзиньсюна из Nvidia неизвестны, т.к. он никогда не делился этим публично, но его цели были очень амбициозны. Чжан хотел предоставить китайскому рынку передовые, высокопроизводительные видеокарты местного производства, сравнимые по эффективности с решениями от Nvidia и предназначенные как для пользовательского, так и для коммерческого или государственного сектора. Также Чжан планировал, чтобы GPU от его компании применялись во множестве сфер, от искусственного интеллекта и высокопроизводительных вычислений до профессиональных задач и игр.
Чжан Цзиньсюн анонсирует видеокарту MTT S4000. Источник: Moore Threads.
Заявления и планы Чжана Цзиньсюна были очень многообещающими и перспективными, благодаря чему в первый год своего существования компания Moore Threads привлекла инвестиции в размере $300 миллионов от таких известных вкладчиков, как Shenzhen Capital Group, GGV Capital, Sequoia Capital China, ByteDance и Tencent. Эти средства были направлены на расширение исследовательской базы и ускорение разработки передовых продуктов, в результате чего уже в 2022 году дебютировали первые решения компании Moore Threads — MTT S60 для ПК и рабочих станций, а также MTT S2000 для высокопроизводительных серверов. Оба продукта были разработаны на 12-нм техпроцессе и создавались на базе собственной архитектуры MUSA (Moore Threads Unified System Architecture). В том же году Moore Threads выпустили MTT S80, которые стали первыми полноценными видеокартами, произведенными в Китае. Несмотря на то, что MTT S60 и MTT S2000 не могли сравняться по производительности с видеокартами GeForce RTX 4000, вышедшими в том же году, видеокарты от MTT стали значимым достижением для сектора GPU в КНР, поскольку эти решения стали первыми китайскими видеокартами с поддержкой DirectX.
Видеокарта MTT S2000, вышедшая в 2022 году. Источник: Moore Threads.
Следующий важный этап в развитии компании наступил 2023 году, когда США ввели санкции против Китая, ограничив местным чипмейкерам доступ к передовым техпроцессам TSMC, что по сути полностью остановило все производственные процессы в Moore Threads. Чтобы избежать банкротства, Moore Threads приняла решение максимально оптимизировать бюджет и доступные ресурсы, сократив часть персонала и начав поиск альтернативных фабрик для производства чипов. В конечном итоге выбор пал на китайские заводы SMIC (Semiconductor Manufacturing International Corporation), поэтому производство графических процессоров MTT с этого момента полностью переехало на материковый Китай. Однако, SMIC не имела столь же передовых техпроцессов, что и TSMC, в результате чего конкурентоспособность новых графических решений значительно снизилась.
Несмотря на эти трудности, компания Moore Threads смогла избежать банкротства и продолжила заниматься выпуском новых, технологичных GPU и программного обеспечения для них, включая программный пакет MUSA Toolkit 1.0, инструмент для компиляции MUSIFY, а также драйвера для DirectX 11. Кроме того, в 2023 году компания выпустила новый графический чип QuYuan для обучения больших языковых моделей, а также запустила высокопроизводительный ИИ-кластер KUAE на базе этих LLM-ускорителей. В 2024 году Moore Threads, постепенно адаптируясь к производственным мощностям SMIC, выпустила бюджетные игровые видеокарты MTT S30 и MTT S50.
Видеокарта начального уровня MTT S30, выпущенная в 2024 году. Источник: Moore Threads.
Архитектура GPU
На момент конца 2023 года актуальной версией архитектуры GPU от Moore Threads является MUSA 2.0, которая значительно превосходит предыдущую версию MUSA 1.5 как в производительности, так и функциональном наполнении. Архитектура MUSA 2.0 была разработана для использования в передовых ИИ-ускорителях S4000 и поддерживает широкий спектр задач, начиная от графики, обработки видео и заканчивая высокопроизводительными вычислениями и обучением ИИ. В основе MUSA 2.0 лежит улучшенная многоядерная структура с поддержкой до многопоточных 8192 ядер, благодаря чему обеспечивается высокая параллелизация и увеличение производительности. Архитектура также поддерживает современные графические API, такие как DirectX 12 Ultimate, Vulkan 1.3, а также имеет аппаратные видеокодеки H.264, H.265 (HEVC), AV1 и VP9, благодаря чему устройства на базе MUSA 2.0 можно успешно применять для обработки видео в разрешениях до 8K и запуска современных видеоигр. Помимо этого, MUSA 2.0 имеет широкий набор инструментов для разработки софта, например, библиотеку MTGL (Moore Threads Graphics Library), поддерживающая шейдерные языки HLSL и GLS, а также инструменты для оптимизации производительности MT Profiler. На решениях MUSA 2.0 также можно запускать популярные приложения для работы с мультимедиа, например, Adobe Premiere Pro, DaVinci Resolve, Blender и Autodesk Maya. Также для обеспечения более эффективной работы с мультимедиа MUSA 2.0 поддерживает интеллектуальный движок MT Smart Media Engine 2.0 для ускорения обработки фото и видео в облаке.
Но главным преимуществом MUSA 2.0 является ее оптимизация под выполнение операций машинного обучения и вычислительных задач. Для этого Moore Threads разработала специальную библиотеку MTLIB (Moore Threads Machine Learning Library), которая предоставляет широкий спектр инструментов для работы с нейронными сетями и поддерживает популярные фреймворки, такие как TensorFlow и PyTorch. Это позволяет использовать GPU на базе MUSA 2.0 для обучения больших языковых моделей и выполнения задач инференса ИИ, включая такие популярные ИИ, как GPT, LLaMa*, GLM, Qwen и DeepSeek. Архитектура также включает в себя эмулятор MTCUDA, который обеспечивает совместимость с приложениями, написанными для архитектуры CUDA от компании Nvidia, поэтому китайские разработчики могут с легкостью переносить свой софт для CUDA на платформу MUSA 2.0. Решение в разработке эмулятора MTCUDA вполне оправдано со стороны компании Moore Threads, так как все технологические преимущества графических решений на базе MUSA 2.0, а также адаптация под местный рынок и полный перенос производства GPU MTT на материковый Китай делают чипы этой серии более востребованными, чем решения от западных компаний в лице Nvidia. Это побуждает компании КНР массово переходить на устройства отечественного разработчика, что также подпитывается государственной политикой об импортозамещении всех зарубежных решений на подходящие аналоги от местных разработчиков.
Схема обучения ИИ модели с помощью MTT S4000 на архитектуре MUSA 2.0. Источник: Moore Threads.
Еще одна полезная интеграция — поддержка OpenCL 3.0, которая расширяет возможности использования MUSA 2.0 в научных вычислениях и других областях, требующих от графического процессора максимально высокой производительности. Важно отметить, что MUSA 2.0 также очень энергоэффективна, поскольку разработчики позаботились об оптимизации энергопотребления на уровне архитектуры. Все эти факторы говорят о том, что разработчики компании Moore Threads позаботились о развитии собственной экосистемы, которая поддерживает огромное количество популярного ПО, что также подтверждает универсальность MUSA 2.0 и огромный потенциал развития этой платформы.
До сих пор неизвестно, является ли архитектура MUSA собственной разработкой компании Moore Threads, или это лицензированная графическая архитектура какой-то другой компании. Однако, есть предположения, что верный именно второй вариант, в частности, архитектура MUSA могла быть позаимствована у компании Imagination Technologies, известной своей архитектурой PowerVR Kyro, так как у двух платформ очень много сходств в аппаратной части и характеристиках.
Видеокарта Xindong Fenghua 2, разработанная на базе архитектуры PowerVR Kyro от компании Imagination Technologies. Источник: Tomshardware.
Графические ускорители MTT S4000
MTT S4000 — это мощный, основанный сразу на двух чипах ИИ-ускоритель 2023 года выпуска на базе архитектуры MUSA 2.0 и графическим чипом QuYuan, разработанный для интеграции в инфраструктуры для обучения больших языковых моделей, в частности, вычислительные кластеры KUAE. Благодаря инновационной технологии межсоединения MTLink 1.0 с пропускной способностью 240 ГБ/с, MTT S4000 поддерживает интеграцию до 8-ми GPU для их дальнейшего объединения в вычислительный кластер из тысяч видеокарт.
Moore Threads заявляют, что ИИ производительности MTT S4000 в 25 TFLOPS TP32 (30% от производительности RTX 4090) вполне хватает, чтобы обучать самые современные языковые модели с 60-100 миллиардами параметров, что является достижением не только для индустрии ИИ в Китае, но и для сферы разработки LLM в целом. Помимо этого, MTT S4000 поддерживает расширенный графический рендеринг через такие API, как Vulkan, DirectX, OpenGL и OpenGL ES, кодирование и декодирование видео H.264, H.265, AV1, AVS2 и VP9, а также вывод изображения в UHD 8K HDR на 4 монитора через видеовыходы DisplayPort 1.4a.
Кроме того, для расширения возможностей обучения моделей искусственного интеллекта, MTT S4000 поддерживает следующие основные форматы вычислений с плавающей запятой:
FP32 — 25 TFLOPS;
TF32 Tensor — 50 TFLOPS;
FP16 Tensor — 100 TFLOPS;
INT8 Tensor — 200 TOPS.
Передовой ИИ-ускоритель MTT S4000. Источник: Moore Threads.
Среди других преимуществ MTT S4000 можно выделить наличие аппаратной виртуализации и поддержки технологии SR-IOV, которые обеспечиваются особой технологией автоматического распределения ресурсов GPU MT Mesh 2.0. Поскольку китайские регуляторы требуют от всех технологичных решений для важнейших IT-инфраструктур наличия дополнительных механизмов безопасности, ускорители MTT S4000 оснащены технологией MUSA Security Engine 2.0. MUSA Security Engine 2.0 включает в себя массу софтов безопасности, включая поддержку TEE и поддержку китайских алгоритмов шифрования и дешифрования SM3 и SM4.
Полный список характеристик передового ИИ-ускорителя MTT S4000 выглядит следующим образом:
Характеристика
MTT S4000
Количество ядер
8192
Количество тензорных ядер
128
Объем памяти
48 ГБ GDDR6 ECC
Пропускная способность памяти
768 Гбит/с
Пропускная способность MTLink 1.0
240 Гбит/с
TDP
450 Вт
Решения на базе MTT S4000
Компания MTT, по всей видимости, намеревается потеснить компанию Nvidia не только в Китае, но и во всем мире, представив собственные серверы MCCX D800 на базе ускорителей MTT S4000, а также готовый вычислительный комплекс MTT KUAE, построенные на этих серверах.
ИИ-сервер MCCX D800
MCCX D800 представляет собой универсальный двухсокетный ИИ-сервер с форм-фактором 4U, поддерживающий подключение до 8 GPU MTT S4000 и построенный на базе CPU Intel Xeon Gold 6430. Это решение является составной частью передовых ИИ-кластеров MTT KUAE, оптимизированное не только для проведения операций обучения и инференса больших языковых моделей, но и для широкого спектра иных задач. Благодаря внушительной производительности вычислений с плавающей запятой в 200 TFLOPS для формата FP32 и 800 TFLOPS для формата FP16, MCCX D800 отлично справляются с обучением наиболее требовательных моделей ИИ, включая ChatGPT, Llama*, Qwen и DeepSeek.
Универсальный сервер для ИИ-кластеров MCCX D800. Источник: Moore Threads.
В числе областей применения MCCX D800 можно выделить облачные вычисления, научные вычисление и создание физических симуляций, умный анализ видео в реальном времени, компьютерное моделирование, развертывание виртуальных рабочих мест и многое другое. За счет использования чипов MTT S4000, серверы MCCX D800 поддерживают все возможности и функции экосистемы MUSA. Также сервер поддерживает все популярные операционные системы, включая Windows и Linux, а также китайские национальные ОС, такие как Tencent и Kyrin.
Подробные характеристики передового сервера MCCX D800 выглядят следующим образом:
Характеристика
MCCX D800
Процессоры
2x Intel Xeon Gold 6430 на 32 ядра
Графический процессор
8x MTT S4000
Память
16x DDR5-4800
Максимальный объем памяти
1 ТБ ECC REG
Системные накопители
2x твердотельных накопителя SATA на 480 ГБ
Накопители для хранения данных
4x твердотельных накопителя PCIe Gen 4 NVMe на 3,84 ТБ
MTT KUAE — это готовый вычислительный комплекс для ИИ-дата центров, который состоит из 16 серверов MCCX D800 и 1000 видеокарт MTT S4000, объединенных сетью RDMA. MTT KUAE способен обучать самые требовательные ИИ модели с сотнями миллиардов параметров, имеет встроенное программное обеспечение для управления всей системой и платформу KUAE ModelStudio с инструментами для обучения больших языковых моделей и тонкой настройки ИИ. Moore Threads заявляет, что MTT KUAE может обеспечивать практически линейное масштабирование на 91%, что подтверждается рекордным 33 дневным обучением модели искусственного интеллекта Aquila2 с 70 миллиардами параметров. MTT KUAE также оснащена компилятором MUSIFY, с помощью которого можно мигрировать код CUDA от Nvidia на платформу MUSA, при этом, практически без потерь в оптимизации. Еще один плюс MTT KUAE — ее модульная конструкция, объединяющая все передовые технологические достижения производителя Moore Threads, за счет чего всю систему можно легко масштабировать, а ее установка занимает всего 30 дней.
Вычислительный кластер MTT KUAE, состоящий из более 1000 видеокарт MTT S4000. Источник: Moore Threads.
Игровая видеокарта MTT S80
MTT S80 — это видеокарты с графическим процессором ChunXiao на базе MUSA 1.5 от компании Moore Threads, выпущенные в 2022 году и предназначенные для сектора гейминга. MTT S80, а также их версия для ноутбуков MTT S70 стали первыми видеокартами в мире, впервые начавшие использовать интерфейс PCIe Gen5. Ядра графического процессора имеют тактовую частоту 1,8 ГГц, а производительность самой видеокарты достигает 14,4 TFLOPS в формате FP32, что позволяет применять эти решения для работы с мультимедиа и проведения нетребовательных вычислений. Также видеокарты MTT S80 поддерживают вывод изображения в разрешении 8K UHD и 1080p с частотой обновления 360 Гц на 4 дисплея через видеовыходы DisplayPort 1.4a и HDMI 2.1, что обеспечивается интеграцией технологии MST (Multi-Stream Transport). Помимо этого, карта оснащена аппаратными кодеками AV1, H.264, H.265, VP9 и других, а также поддерживает обработку и воспроизведение видео в формате HDR10. Для управления видеокартой Moore Threads оснастили видеокарту MTT S80 программой PES, через которую можно удобно обновлять драйвера, настраивать дисплей и мониторить состояние устройства. Само собой, видеокарта для гейминга поддерживает такие API, как DirectX и Vulkan.
Видеокарта MTT S80 для китайских геймеров. Источник: Moore Threads.
Подробные характеристики решения MTT S80 перечислены в этой таблице:
Характеристика
MTT S80
Потоковые процессоры
4096
Частота графического процессора
1,8 ГГц
Объем памяти
16 ГБ GDDR6 ECC
Ширина шины памяти
256 бит
Пропускная способность памяти
448 Гбит/с
TDP
255 Вт
Несмотря на весьма впечатляющие характеристики, выход MTT S80 был омрачен после появления первых результатов тестирования. Видеокарты MTT S80 имели проблемы с оптимизацией, поддерживали малое количество приложений, а также потребляли много электроэнергии. Moore Threads не спешила решать эти проблемы, приступив к доработке видеокарт лишь спустя пару месяцев после их релиза, однако, это не привело к резкому взлету производительности. Важно учитывать, что MTT S80 разрабатывались с оптимизацией именно под китайские игры и местные приложения, что может в некоторой степени объяснять низкую эффективность этих видеокарт, т.к. тесты проводились в западных современных играх.
Видеокарта MTT S80 без системы охлаждения. Источник: Expreview.
Слитые видеокарты MTT S90
В данный момент в сети можно встретить информацию о готовящемся запуске MTT S90, о чем говорят как западные, так и китайские пользователи. О новом поколении видеокарт для гейминга сеть смогла узнать из слитых в 2023 году файлов компании Moore Threads. Вместе с информацией о существовании MTT S90, пользователи также узнали об ИИ-ускорителях MTT S4000, которые впоследствии вышли в этом же году. По всей видимости, релиз MTT S90 был назначен в один год вместе с ускорителями S4000, однако, внесение компании Moore Threads в санкционные списки США исключило возможность выхода этих видеокарт в 2023 году. С тех пор какой-либо информации об этих решениях нового поколения не появлялось, поэтому вполне возможно, что из-за перехода на менее современный техпроцесс, компании пришлось отложить идею выпуска MTT S90 в долгий ящик, вместо них представив рынку видеокарты начального уровня S30 в 2024 году.
Слитые файлы Moore Threads с упоминанием MTT S90. Источник: DeviceHunt.
Конкурентоспособность
Судя по результатам тестирований, проведенных Moore Threads, ускорители MTT S4000 отлично показывают себя в обучении больших языковых моделей, заняв третье место, уступив моделям, которые обучались на ускорителях Nvidia. Обучение нейросети MT-infini-3B заняло в общей сложности 13 дней, причем, при работе не было замечено сбоев или вынужденных остановок системы. Это весьма хорошие результаты, так как обычно обучение языковых моделей занимает вплоть до 1 месяца и более, и за это время ускорители нередко выходят из строя. Неизвестно, на каких именно ускорителях от Nvidia обучались другие модели ИИ — A100, H100 или H200, однако, в сети есть предположения, что модели обучались на ИИ-ускорителях A100, основанные на подсчетах пользователей.
Модель, обученная на ускорителях MTT S4000, заняла 3 место по производительности в сравнении с моделями, полученными на Nvidia A100. Источник: Moore Threads.
Результаты тестирований MTT S80 оказались очень неоднозначными: в ряде синтетических тестов MTT S80 превзошли видеокарты NVIDIA GeForce RTX 3060, опережая их более чем в 2-3 раза, но другие тесты показали отставание — в Unigine Valley 1.0 модель от Moore Threads продемонстрировала производительность уровня GeForce GTX 1060 или Radeon RX 480.
Сравнение видеокарт MTT S80 с RTX 3060 в бенчмарке 3DMark, в котором китайские видеокарты вышли в лидеры. Источник: Expreview.
Сравнение MTT S80 с RTX 3060 в бенчмарке Unigine Valley 1.0 показывает, что китайские GPU сильно уступают аналогу. Источник: Expreview.
В играх положение MTT S80 тоже не самое похвальное. Видеокарта хорошо показывает себя только в таких нетребовательных играх, как Counter-Strike: GO, CrossFire, League of Legends и Diablo III на уровне в 213, 180, 144 и 90-100 к/c соответственно при низких настройках графики в разрешении 1080p. При таких результатах MTT S80 потребляет в среднем 210 Вт, а под нагрузкой 240 Вт. Режим ожидания требует потребления 115 Вт энергии, что не есть хорошо для видеокарты такого уровня.
Выводы
Исходя из всех изложенных выше фактов, становится понятно, что компания Moore Threads выпускает самые производительные видеокарты в Китае, и у этих решений есть все шансы не только вытеснить всех местных конкурентов, но и выдавить с рынка Поднебесной таких гигантов индустрии, как Nvidia и AMD. Причем, несмотря использование не самых современных техпроцессов, отражающихся на отставании в производительности от видеокарт Nvidia и AMD, процесс импортозамещения западных графических решений на устройства Moore Threads уже запущен и активно идет. Это объясняется тем, что компания способна не просто предложить пару интересных устройств, а создать целый ряд собственных высокоэффективных решений, которые затрагивают как потребительский сегмент вместе с серией MTT S80, так и сектор разработки ИИ c помощью ускорителей S4000 и кластеров MTT KUAE.
*LLAMA — проект Meta Platforms Inc., деятельность которой в России признана экстремистской и запрещена
**Деятельность Meta Platforms Inc. в России признана экстремистской и запрещена
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Получите скидку 3 000 рублей или бесплатную доставку за подписку на новости*!
* — скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка.
Мы получили ваш отзыв!
Он появится на сайте после модерации.
Мы получили ваш отзыв!
Он появится на сайте после модерации.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.