Nvidia Rubin — новый этап в развитии искусственного интеллекта
Автор: ServerFlow
В статье рассказывается об архитектуре Nvidia Rubin, которая произвела революцию в сфере искусственного интеллекта
Содержание:
Введение
Основные задачи архитектуры Nvidia Rubin
Особенности архитектуры Nvidia Rubin
Rubin GPU 8S HBM4
Rubin GPU Ultra 12S HBM4
Vera CPU
NVLink Switch 6-ого поколения
CX9 SuperNIC 1600 ГБ/с
X1600 IB Ethernet Switch
Заключение
Введение
Архитектура Nvidia Rubin, представленная в июне 2024 года на конференции Computex вместе с архитектурой Blackwell, является новым этапом в развитии высокопроизводительных вычислений для искусственного интеллекта. Решения Nvidia Rubin, такие как графические процессоры серии R-100 (Rubin-100) и центральные процессоры Vera, выйдут в продажу в конце 2026 года. Эта архитектура знаменует собой прорыв в области технологий ИИ, а именно ускорения процесса обучения и инференса нейросетей и повышения общей производительности графических процессоров. Rubin позиционируется как преемник архитектуры Blackwell, которая предложит решения для ИИ совершенно нового уровня, невиданного в индустрии полупроводниковых чипов. В этой статье мы расскажем вам, для чего нужна архитектура Nvidia Rubin, в чем ее особенности, а также какие инновационные технологии она предлагает.
Roadmap компании Nvidia с анонсов продуктов Rubin в 2026-2027 году. Источник: Nvidia.
Основные задачи архитектуры Nvidia Rubin
Главная задача Rubin и новых технологических решений, таких как новая серия GPU R-100 и Vera CPU, заключается в обеспечении значительного улучшения производительности как в процессе обучения моделей ИИ, так и в их инференсе нейросетей. В связи с ростом сложности и масштабов моделей ИИ, потребность в ускорении вычислений возрастает, поэтому архитектура Rubin ориентирована на удовлетворение этих требований, например, обеспечение нового уровня пропускной способности, низкого энергопотребления и поддержки масштабируемости до 12 GPU формата SXM на одну платформу. Благодаря новым чипам и инновационным решениям в области межпроцессорных соединений, архитектура обеспечивает не только повышение производительности, но и улучшение энергоэффективности, что особенно важно при использовании Nvidia Rubin в крупных вычислительных систем. Rubin также поддерживает более высокие показатели масштабируемости, что делает эти чипы подходящими для широкого спектра задач, включая работу с большими моделями ИИ.
Особенности архитектуры Nvidia Rubin
Архитектура Rubin интегрирует передовые технологии, которые позволяют достичь нового уровня производительности в высокопроизводительных вычислениях и машинном обучении. Вот какие инновационные решения будут представлены в новой архитектуре Nvidia Rubin:
Rubin GPU 8S HBM4
Rubin GPU 8S HBM4 — один из ключевых графических процессоров серии R100, представленных в рамках новой архитектуры Nvidia Rubin. Этот чип спроектирован специально для высокопроизводительных задач в области ИИ, таких как обучение глубоких нейронных сетей и их инференс. Одной из главных особенностей Rubin GPU 8S HBM4 является использование 8-ти кристаллов в стеке памяти формата HBM4 (High Bandwidth Memory), которая предоставляет значительно большую пропускную способность по сравнению с предыдущими поколениями. Это позволяет в разу ускорить обработку больших массивов данных и существенно повысить общую производительность системы. Применение HBM4 памяти также способствует улучшению энергоэффективности за счет более быстрой обработки данных с меньшими энергозатратами. Rubin GPU 8S также использует оптимизированную архитектуру для параллельных вычислений — Vera. Это делает GPU идеальным для развертывания в современных системах обучения ИИ, где каждый дополнительный процент производительности может существенно повлиять на скорость выполнения задач.
Поставки Rubin GPU 8S ожидаются в виде готовых HGX модулей оснащенных 8 графическими ускорителями. Источник: Nvidia.
Rubin GPU Ultra 12S HBM4
Rubin GPU Ultra 12S HBM4 — это флагманский графический процессор серии R-100, разработанный в рамках архитектуры Nvidia Rubin, который отличается еще более высокими показателями производительности по сравнению с Rubin GPU 8S. Основное преимущество Ultra 12S HBM4 заключается в увеличенном количестве вычислительных блоков и интеграции еще более быстрой памяти HBM4 с 12-ю стеками. Чип предоставляет высокую пропускную способность памяти, что позволяет эффективно обрабатывать массивы данных, необходимые для глубокого обучения и других ИИ-задач. Благодаря увеличенной плотности расположения транзисторов и совместимости с новой архитектурой CPU Vera, Ultra 12S обеспечивает максимальную производительность при минимальных задержках и низком энергопотреблении.
Кроме того, Rubin GPU Ultra 12S оптимизирован для работы в распределенных вычислительных средах, что делает его особенно подходящим для кластеров ИИ и суперкомпьютеров, где масштабируемость и пропускная способность являются важнейшими характеристиками.Также решение Ultra 12S обеспечивает улучшенное распределение ресурсов между задачами, благодаря чему энергия расходуется гораздо более эффективнее, что снижает затраты на эксплуатацию устройств.
Ожидается, что чип Rubin превзойдет текущие типы Blackwell по размерам, что выведет GPU на новый уровень по площади кристалла. Источник: Nvidia.
Vera CPU
Vera CPU — это новые ARM CPU на 3-нм техпроцессе, созданные с учетом требований к ускорению как обучения, так и инференса глубоких нейронных сетей. Vera является одним из ключевых нововведений в экосистеме Nvidia Rubin, которое будет интегрироваться c графическими процессорами серии R100 и продвинутой памятью формата HBM4 с усовершенствованными вычислительными блоками. Процессор Vera, который является преемником чипов Nvidia Grace архитектуры Blackwell, также интегрирован с новыми коммуникационными технологиями, такими как NVLink 6 и ConnectX 9 SuperNIC, что позволяет минимизировать задержки при передаче данных и достигать максимальной скорости обмена информацией в высокопроизводительных вычислительных системах. Также на базе этих CPU выйдет особый суперчип под названием Vera Rubin, представляющий собой связку графического и центрального процессоров. Название новые суперчипы получили от Веры Флоренс Купер Рубин — астронома-первопроходца, которая установила наличие тёмной материи.
Внешний вид superchip Nvidia поколения Blackwell демонстрирует два распаянных графических процессора и один центральный процессор Nvidia Grace. В поколении Rubin все компоненты будут замещены на новые Vera CPU и Rubin GPU. Источник: Nvidia.
NVLink Switch 6-ого поколения
Шина NVLink 6 Switch также является одним из важнейших нововведений архитектуры Nvidia Rubin, обеспечивая значительное улучшение пропускной способности до 3600 ГБ/с, что в два раза превышает пропускную способность шины 5-ого поколения архитектуры Blackwell, достигающую только 1800 ГБ/с. Эта технология разработана для эффективного соединения множества графических процессоров (GPU) в рамках высокопроизводительных вычислительных систем. Возможности масштабирования NVLink 6 Switch позволяют соединять до 16 GPU в одном кластере, обеспечивая низкую задержку передачи данных, что улучшает общую производительность систем. В сочетании с другими компонентами Nvidia, такими как сетевой адаптером CX9 SuperNIC и сетевым коммутатором X1600 IB Ethernet Switch, NVLink 6 создает мощную и гибкую сетевую инфраструктуру, соответствующую всем требованиям сферы разработки и обучения искусственного интеллекта.
Устройство NVLink Switch позволяет эффективно масштабировать GPU инфраструктуру в рамках вычислительного кластера. Источник: Nvidia.
CX9 SuperNIC 1600 ГБ/с
ConnectX 9 SuperNIC — это сетевой адаптер созданный для работы с архитектурой Nvidia Rubin, который обеспечивает впечатляющую скорость передачи данных, достигающую 1600 ГБ/с. Этот сетевой адаптер предназначен для работы с высокопроизводительными вычислительными системами, обеспечивая быструю и эффективную передачу данных между компонентами системы, такими как CPU и GPU. Благодаря своей высокой пропускной способности и минимальным задержкам, Это устройство также обеспечивает поддержку различных протоколов передачи данных, что расширяет спектр использования новых графических процессоров R100.
Сетевой адаптер ConnectX предыдущего поколения. Источник: ServeTheHome.
X1600 IB Ethernet Switch
X1600 IB Ethernet Switch является высокопроизводительным сетевым коммутатором, разработанным для обеспечения масштабируемой и эффективной сетевой инфраструктуры в системах на базе архитектуры Nvidia Rubin. С его помощью достигается высокая пропускная способность и низкие задержки при передаче данных, а также поддержка стандарта InfiniBand (IB) с портами типа QSFP-DD1600, число которых может достигать от 64-х до 128, что позволяет коммутатору интегрироваться в сети передовых суперкомпьютеров и другие высокоскоростные сети, обеспечивая при этом гибкость настройки и возможность конфигурирования. Одной из главных особенностей коммутатора X1600 является его пропускная способность, достигающая 1600 ГБ/с на один порт, что значительно ускоряет взаимодействие между компонентами системы и улучшает производительность при работе с задачами глубокого обучения ИИ и анализа больших данных.
Внешний вид коммутаторов Quantum прошлых поколений с пропускной способностью до 800 гигабит в секунду. Источник: Nvidia.
Заключение
Архитектура Nvidia Rubin — это совершенно новый этап в эволюции технологий сферы разработки искусственного интеллекта и машинного обучения. Благодаря новым чипам, таким как Rubin GPU 8S и 12S, технологиям NVLink и CX9 SuperNIC, а также новому поколению сетевых решений, таких как X1600 IB Ethernet Switch, новая архитектура предложит совершенно новый уровень производительности для ИИ-операций. Вслед за решениями архитектуры Blackwell, характеристики которой и так внесли большой вклад в сектор инференса и создания ИИ, Nvidia решили продолжить привносить в эту сферу инновации, которые окончательно закрепят статус компании как главного поставщика технологических решений сферы разработки больших нейронных сетей, так как конкуренты Nvidia, скорее всего, еще долго не смогут приблизиться к таким же передовым мощностям.
Nvidia Rubin — новый этап в развитии искусственного интеллекта
Архитектура Nvidia Rubin, представленная в июне 2024 года на конференции Computex вместе с архитектурой Blackwell, является новым этапом в развитии высокопроизводительных вычислений для искусственного интеллекта. Решения Nvidia Rubin, такие как графические процессоры серии R-100 (Rubin-100) и центральные процессоры Vera, выйдут в продажу в конце 2026 года. Эта архитектура знаменует собой прорыв в области технологий ИИ, а именно ускорения процесса обучения и инференса нейросетей и повышения общей производительности графических процессоров. Rubin позиционируется как преемник архитектуры Blackwell, которая предложит решения для ИИ совершенно нового уровня, невиданного в индустрии полупроводниковых чипов. В этой статье мы расскажем вам, для чего нужна архитектура Nvidia Rubin, в чем ее особенности, а также какие инновационные технологии она предлагает.
Roadmap компании Nvidia с анонсов продуктов Rubin в 2026-2027 году. Источник: Nvidia.
Основные задачи архитектуры Nvidia Rubin
Главная задача Rubin и новых технологических решений, таких как новая серия GPU R-100 и Vera CPU, заключается в обеспечении значительного улучшения производительности как в процессе обучения моделей ИИ, так и в их инференсе нейросетей. В связи с ростом сложности и масштабов моделей ИИ, потребность в ускорении вычислений возрастает, поэтому архитектура Rubin ориентирована на удовлетворение этих требований, например, обеспечение нового уровня пропускной способности, низкого энергопотребления и поддержки масштабируемости до 12 GPU формата SXM на одну платформу. Благодаря новым чипам и инновационным решениям в области межпроцессорных соединений, архитектура обеспечивает не только повышение производительности, но и улучшение энергоэффективности, что особенно важно при использовании Nvidia Rubin в крупных вычислительных систем. Rubin также поддерживает более высокие показатели масштабируемости, что делает эти чипы подходящими для широкого спектра задач, включая работу с большими моделями ИИ.
Особенности архитектуры Nvidia Rubin
Архитектура Rubin интегрирует передовые технологии, которые позволяют достичь нового уровня производительности в высокопроизводительных вычислениях и машинном обучении. Вот какие инновационные решения будут представлены в новой архитектуре Nvidia Rubin:
Rubin GPU 8S HBM4
Rubin GPU 8S HBM4 — один из ключевых графических процессоров серии R100, представленных в рамках новой архитектуры Nvidia Rubin. Этот чип спроектирован специально для высокопроизводительных задач в области ИИ, таких как обучение глубоких нейронных сетей и их инференс. Одной из главных особенностей Rubin GPU 8S HBM4 является использование 8-ти кристаллов в стеке памяти формата HBM4 (High Bandwidth Memory), которая предоставляет значительно большую пропускную способность по сравнению с предыдущими поколениями. Это позволяет в разу ускорить обработку больших массивов данных и существенно повысить общую производительность системы. Применение HBM4 памяти также способствует улучшению энергоэффективности за счет более быстрой обработки данных с меньшими энергозатратами. Rubin GPU 8S также использует оптимизированную архитектуру для параллельных вычислений — Vera. Это делает GPU идеальным для развертывания в современных системах обучения ИИ, где каждый дополнительный процент производительности может существенно повлиять на скорость выполнения задач.
Поставки Rubin GPU 8S ожидаются в виде готовых HGX модулей оснащенных 8 графическими ускорителями. Источник: Nvidia.
Rubin GPU Ultra 12S HBM4
Rubin GPU Ultra 12S HBM4 — это флагманский графический процессор серии R-100, разработанный в рамках архитектуры Nvidia Rubin, который отличается еще более высокими показателями производительности по сравнению с Rubin GPU 8S. Основное преимущество Ultra 12S HBM4 заключается в увеличенном количестве вычислительных блоков и интеграции еще более быстрой памяти HBM4 с 12-ю стеками. Чип предоставляет высокую пропускную способность памяти, что позволяет эффективно обрабатывать массивы данных, необходимые для глубокого обучения и других ИИ-задач. Благодаря увеличенной плотности расположения транзисторов и совместимости с новой архитектурой CPU Vera, Ultra 12S обеспечивает максимальную производительность при минимальных задержках и низком энергопотреблении.
Кроме того, Rubin GPU Ultra 12S оптимизирован для работы в распределенных вычислительных средах, что делает его особенно подходящим для кластеров ИИ и суперкомпьютеров, где масштабируемость и пропускная способность являются важнейшими характеристиками.Также решение Ultra 12S обеспечивает улучшенное распределение ресурсов между задачами, благодаря чему энергия расходуется гораздо более эффективнее, что снижает затраты на эксплуатацию устройств.
Ожидается, что чип Rubin превзойдет текущие типы Blackwell по размерам, что выведет GPU на новый уровень по площади кристалла. Источник: Nvidia.
Vera CPU
Vera CPU — это новые ARM CPU на 3-нм техпроцессе, созданные с учетом требований к ускорению как обучения, так и инференса глубоких нейронных сетей. Vera является одним из ключевых нововведений в экосистеме Nvidia Rubin, которое будет интегрироваться c графическими процессорами серии R100 и продвинутой памятью формата HBM4 с усовершенствованными вычислительными блоками. Процессор Vera, который является преемником чипов Nvidia Grace архитектуры Blackwell, также интегрирован с новыми коммуникационными технологиями, такими как NVLink 6 и ConnectX 9 SuperNIC, что позволяет минимизировать задержки при передаче данных и достигать максимальной скорости обмена информацией в высокопроизводительных вычислительных системах. Также на базе этих CPU выйдет особый суперчип под названием Vera Rubin, представляющий собой связку графического и центрального процессоров. Название новые суперчипы получили от Веры Флоренс Купер Рубин — астронома-первопроходца, которая установила наличие тёмной материи.
Внешний вид superchip Nvidia поколения Blackwell демонстрирует два распаянных графических процессора и один центральный процессор Nvidia Grace. В поколении Rubin все компоненты будут замещены на новые Vera CPU и Rubin GPU. Источник: Nvidia.
NVLink Switch 6-ого поколения
Шина NVLink 6 Switch также является одним из важнейших нововведений архитектуры Nvidia Rubin, обеспечивая значительное улучшение пропускной способности до 3600 ГБ/с, что в два раза превышает пропускную способность шины 5-ого поколения архитектуры Blackwell, достигающую только 1800 ГБ/с. Эта технология разработана для эффективного соединения множества графических процессоров (GPU) в рамках высокопроизводительных вычислительных систем. Возможности масштабирования NVLink 6 Switch позволяют соединять до 16 GPU в одном кластере, обеспечивая низкую задержку передачи данных, что улучшает общую производительность систем. В сочетании с другими компонентами Nvidia, такими как сетевой адаптером CX9 SuperNIC и сетевым коммутатором X1600 IB Ethernet Switch, NVLink 6 создает мощную и гибкую сетевую инфраструктуру, соответствующую всем требованиям сферы разработки и обучения искусственного интеллекта.
Устройство NVLink Switch позволяет эффективно масштабировать GPU инфраструктуру в рамках вычислительного кластера. Источник: Nvidia.
CX9 SuperNIC 1600 ГБ/с
ConnectX 9 SuperNIC — это сетевой адаптер созданный для работы с архитектурой Nvidia Rubin, который обеспечивает впечатляющую скорость передачи данных, достигающую 1600 ГБ/с. Этот сетевой адаптер предназначен для работы с высокопроизводительными вычислительными системами, обеспечивая быструю и эффективную передачу данных между компонентами системы, такими как CPU и GPU. Благодаря своей высокой пропускной способности и минимальным задержкам, Это устройство также обеспечивает поддержку различных протоколов передачи данных, что расширяет спектр использования новых графических процессоров R100.
X1600 IB Ethernet Switch является высокопроизводительным сетевым коммутатором, разработанным для обеспечения масштабируемой и эффективной сетевой инфраструктуры в системах на базе архитектуры Nvidia Rubin. С его помощью достигается высокая пропускная способность и низкие задержки при передаче данных, а также поддержка стандарта InfiniBand (IB) с портами типа QSFP-DD1600, число которых может достигать от 64-х до 128, что позволяет коммутатору интегрироваться в сети передовых суперкомпьютеров и другие высокоскоростные сети, обеспечивая при этом гибкость настройки и возможность конфигурирования. Одной из главных особенностей коммутатора X1600 является его пропускная способность, достигающая 1600 ГБ/с на один порт, что значительно ускоряет взаимодействие между компонентами системы и улучшает производительность при работе с задачами глубокого обучения ИИ и анализа больших данных.
Внешний вид коммутаторов Quantum прошлых поколений с пропускной способностью до 800 гигабит в секунду. Источник: Nvidia.
Заключение
Архитектура Nvidia Rubin — это совершенно новый этап в эволюции технологий сферы разработки искусственного интеллекта и машинного обучения. Благодаря новым чипам, таким как Rubin GPU 8S и 12S, технологиям NVLink и CX9 SuperNIC, а также новому поколению сетевых решений, таких как X1600 IB Ethernet Switch, новая архитектура предложит совершенно новый уровень производительности для ИИ-операций. Вслед за решениями архитектуры Blackwell, характеристики которой и так внесли большой вклад в сектор инференса и создания ИИ, Nvidia решили продолжить привносить в эту сферу инновации, которые окончательно закрепят статус компании как главного поставщика технологических решений сферы разработки больших нейронных сетей, так как конкуренты Nvidia, скорее всего, еще долго не смогут приблизиться к таким же передовым мощностям.
06.12 2024
Трансформеры — новое слово в развитии искусственного интеллекта
Статьи
06.12 2024
200$ в месяц: Почему новый ChatGPT o1 Pro стоит в 10 раз дороже?
Получите скидку 3 000 рублей или бесплатную доставку за подписку на новости*!
* — скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка.
Мы получили ваш отзыв!
Он появится на сайте после модерации.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.