Израильский стартап NeuReality представил передовой процессор NR1, который разработан для выполнения оркестрации работы задач при инференсе искусственного интеллекта. Новейшее ИИ-решение может работать в сочетании с CPU и GPU, улучшая эффективность графических процессоров при локальном развертывании в 2 раза.
Подробнее о стартапе NeuReality
Представители израильской компании NeuReality заявляют, что основная проблема современных вычислительных систем заключается в том, что производители GPU многие годы совершенствовали свои устройства, чтобы соответствовать растущим требованиями сектора ИИ. В то же время, центральные процессоры не претерпевали действительно кардинальных изменений, по сути оставаясь все теми же решениями, которые использовались еще в доинтернетную эпоху, уже не говоря об ИИ-революции. Вследствие этого, центральные процессоры выступают неким балансом в масштабировании производительности GPU. Именно эту проблему компания предлагает решить с помощью сопроцессора NR1.
Что такое NR1?
Сопроцессор NR1 — это интересное решение, которое предлагает альтернативный способ улучшения инференса искусственного интеллекта в вычислительных системах. Если стандартное сочетание центрального, графического процессора и сетевой карты обеспечивает примерно 30-50% эффективности инференса, тогда как связка GPU и NR1 увеличивает производительность инференса на 100%. Тем самым, сопроцессор NR1 решает узкое место в секторе ИИ-нагрузок, обеспечивая значительный прирост пропускной способности графических ускорителей в крупных вычислительных системах, например, дата-центрах и ИИ-кластерах.
Показатели производительности инференса при использовании процессоров x86 и сопроцессоров NR1. Источник: NeuReality.
NR1 поддерживает весь функционал центральных процессоров, которые необходимы для работы с ИИ-операциями. Кроме того, NR1 имеет компоненты для обработки мультимедиа и данных, аппаратный гипервизор и комплексные сетевые IP-блоки. Гипервизор отвечает за обработку путей данных и планирование выполняемых задач, включая механизмы обработки данных и сетевой движок AI-over-Fabric.
Рассмотрим архитектуру решения NeuReality NR1 более подробно:
4 декодера видео/JPEG.
16 DSP для аудио/речи.
16 векторных DSP общего назначения.
Сетевой движок AI-over-Fabric (TCP/ROCEv2).
2 порта 10/25/50/100 GbE с шифрованием трафика на лету.
Поддержку соединений клиент-сервер и сервер-сервер.
Благодаря этому, сопроцессор обеспечивает более высокую производительность в ИИ-задачах, при этом снижая энергопотребление, что также уменьшает накладные расходы при эксплуатации вычислительной системы. Во внутренних тестах NeuReality инференс генеративной ИИ-модели система на базе ИИ-ускорителя и чипа NR1 генерирует в 6,5 раза больше токенов, чем традиционный x86-сервер при той же стоимости и энергопотреблении. Как отмечает NeuReality, решение NR1, благодаря комплексной разгрузке ИИ-конвейера, также способствует популяризации растущей тенденции на изоляцию ИИ-процессов в системах, направленных на общие вычисления, таких как дата-центры и облачные инфраструктуры. Для DevOps и MLOps стартап NeuReality также полный SDK и сервисный слой на основе Kubernetes.
Выводы
Несмотря на перспективные заявления NeuReality, нельзя точно сказать, станут ли наиболее крупные компании из сектора HPC интегрировать новейшие ИИ-чипы NR1 в свои инфраструктуры. К тому же, такие крупные производители центральных процессоров, как AMD, Intel и Nvidia (ARM-процессоры Grace) постоянно улучшают ИИ-возможности своих CPU, задавая тенденцию инференса именно на центральных процессорах. Тем не менее, рост экологических требований к энергопотреблению центральных процессоров и развитие различных типов ИИ-оборудования может сподвигнуть некоторые дата-центры к использованию решений компании NeuReality.
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Получите скидку 3 000 рублей или бесплатную доставку за подписку на новости*!
* — скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка.
Мы получили ваш отзыв!
Он появится на сайте после модерации.
Мы получили ваш отзыв!
Он появится на сайте после модерации.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.