Компания Enfabrica представила технологию EMFASYS, объединяющую Ethernet RDMA и CXL для формирования пулов памяти, предназначенных для использования в серверных стойках на базе ИИ-ускорителей. Решение способно снизить нагрузку на высокоскоростную память HBM в GPU, повышая общую эффективность системы.
Подробнее о EMFASYS
Компания Enfabrica, основанная в 2019 году, предлагает платформу ACF на базе собственных ASIC-чипов, использующих интерфейс CXL. Платформа обеспечивает прямое соединение любой комбинации GPU, CPU, DDR5 CXL и SSD-накопителей, а также предоставляет высокоскоростной интерконнект с пропускной способностью 800GbE. Компания разработала собственный чип ACF SuperNIC (ACF-S) для создания высокопроизводительных сетей внутри GPU-кластеров для разработки искусственного интеллекта. В рамках использования технологии EMFASYS, специализированный пул памяти подключается к GPU-серверам через коммутаторный чип ACF-S с пропускной способностью 3,2 Тбит/с, интегрирующий PCIe/CXL и Ethernet. Поддерживаются интерфейсы 800GbE, 400GbE и 100GbE, 32 сетевых порта и 160 линий PCIe. Могут использоваться до 144 линий CXL 2.0, обеспечивая доступ к 18 ТБ памяти DDR5 с перспективой расширения до 28 ТБ. Вместо копирования данных между чипами, Enfabrica применяет единый SuperNIC, представляющий память как целевое RDMA-устройство для ИИ-приложений. Высокая пропускная способность достигается распределением операций более чем по 18 каналам в системе. Время задержки при операциях чтения измеряется в микросекундах. Программный стек на основе InfiniBand Verbs обеспечивает массовую параллельную передачу данных с агрегированной полосой пропускания между GPU-серверами и DRAM через группы сетевых портов 400/800GbE.
Схема работы чипа ACF-S с технологией EMFASYS для расширения пулов памяти. Источник: Enfabrica.
Выводы
Компания Enfabrica подчеркивает, что их решение крайне покажет себя крайне эффективно в условиях экспоненциального роста нагрузок, которые создаются посредством развития генеративного, агентного и рассуждающего ИИ. Зачастую таким приложениям требуется в 10–100 раз больше вычислительных ресурсов на запрос, чем для LLM прошлого поколения. Перегруженная память HBM приводит к простаиванию дорогостоящих GPU-ускорителей. Технология EMFASYS решает эту проблему через расширение пулов памяти, обеспечивая более полную загрузку GPU и заявленную экономию до 50% на токен в расчете на одного пользователя.
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Получите скидку 3 000 рублей или бесплатную доставку за подписку на новости*!
* — скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка.
Мы получили ваш отзыв!
Он появится на сайте после модерации.
Мы получили ваш отзыв!
Он появится на сайте после модерации.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.