Supermicro AS-5126GS-TNRT2 (8× RTX PRO 6000 BSE 96GB, 2× EPYC 9554, RAM 1.5TB)

Name: Supermicro AS-5126GS-TNRT2 (8× RTX PRO 6000 BSE 96GB, 2× EPYC 9554, RAM 1.5TB)
Brand: Supermicro
Price: 17586200 RUB
Availability: PreOrder

Supermicro AS-5126GS-TNRT2 (8× RTX PRO 6000 BSE 96GB, 2× EPYC 9554, RAM 1.5TB) 1

Supermicro AS-5126GS-TNRT2 (8× RTX PRO 6000 BSE 96GB, 2× EPYC 9554, RAM 1.5TB) 2

Новый

+200 ₽

Цена с учетом расширенной гарантии

Цена включает НДС 7%

17 586 200 руб.

Под заказ

Узнать сроки доставки

Получить спец. цену Получить КП за час Отправить КП себе на почту

добавить В корзину

Сравнить

Гарантия 1 год с заменой компонентов

Доставка СДЭК и ведущими службами доставки

Тестируем оборудование
перед отправкой

Гарантия 1 год с заменой компонентов

Подробнее

Условия доставки и самовывоза

Подробнее

Помощь в вопросе выбора и совместимости

Подробнее

Характеристики Доставка и оплата Гарантия Отзывы Trade In

Пользовательский мануал AS-5126GS-TNRT2.pdf

Тип	Новые
Основная задача	Обучение моделей / Инференс / Дообучение моделей / RAG-системы / Визуализация и рендеринг
Процессор (CPU)	AMD EPYC
Видеокарта (GPU)	NVIDIA RTX PRO 6000 Blackwell
Количество GPU, шт	8
Общий объем видеопамяти (VRAM), ГБ	768
Тип памяти GPU	GDDR7
Объем оперативной памяти (RAM), ГБ	1536
Тип оперативной памяти	DDR5 ECC REG
Форм-фактор	5U

Подробные характеристики

Подробное описание

Этот сервер в нашей конфигурации ServerFlow рассчитан на тяжёлые AI-нагрузки и стабильный продакшен: сервер отлично подходит для Инференс / Развертывание (Inference), RAG-системы (Retrieval-Augmented Generation), Дообучение моделей (Fine-tuning) и Обучение моделей (Training), а также для Визуализация и рендеринг и Видеоаналитика / Видеонаблюдение.

В основе - NVIDIA RTX PRO 6000 Blackwell Server Edition и суммарно 768 GB VRAM (8×96 GB, GDDR7, ECC). Такой запас памяти даёт комфортный запуск крупных LLM, высокий параллелизм (несколько сервисов/реплик), большой контекст и устойчивую работу с KV-cache. Поддерживаются современные режимы ускорения (включая FP4/FP8/INT8/FP16 в зависимости от пайплайна) и экосистема CUDA для актуальных библиотек и фреймворков.

В сервере 24 DIMM-слота, сейчас задействовано 12, поэтому конфигурация легко расширяется - можно “докинуть” память без замены текущих модулей. Также доступно расширение через M.2.

Производительность GPU

Тип точности	Совокупная мощность восьми RTX PRO 6000 BSE
FP32	960 TFLOPS
FP4	32 PFLOPS
RT Core performance*	2840 TFLOPS

*-RT Core performance - это пиковая производительность специализированных RT-ядер (Ray Tracing Cores), которые аппаратно ускоряют операции трассировки лучей (поиск пересечений луча с геометрией и обход BVH). Показатель важен для визуализации/рендеринга и некоторых графических/3D-пайплайнов, но не является прямым аналогом FP32/AI-производительности.

Совместимость с LLM-моделями

Модель	Тип квантизации	Требуется VRAM	Совместимость	Примечание
DeepSeek-R1 685B	Нет	Примерно 689GB	✅	Запускается на одном сервере с 8× RTX PRO 6000 BSE (768GB VRAM) за счёт multi-GPU распределения (tensor/pipeline parallel) через vLLM/TensorRT-LLM; ориентирован на сложные reasoning-сценарии и очень длинный контекст.
Qwen3.5-397B-A17B-FP8	FP8	Примерно 406GB	✅	Отлично масштабируется по 8 GPU в рамках одного узла; подходит для продакшн-чатов, агентов и RAG-систем с высоким QPS и длинными диалогами.
Gpt-oss:120b	Нет	Примерно 196GB	✅	Комфортно работает в рамках одного сервера: можно держать модель без квантизации и параллельно запускать несколько сервисов/реплик благодаря большому запасу VRAM и пропускной способности Blackwell.
GigaChat3-702B-A36B-preview	Нет	Примерно 720GB	✅	Помещается на одном узле 8×96GB и запускается в multi-GPU режиме; хорошо для крупных ассистентов, длинного контекста и нескольких одновременных потоков инференса.
Mistral-Large-3-675B-Instruct-251	Нет	Примерно 682GB	✅	Оптимальна для аналитических и reasoning-задач в multi-GPU режиме на одном сервере; удобна для RAG и агентных сценариев с большим контекстом.
GLM-5-FP8	FP8	Примерно 756GB	✅	FP8-режим эффективно раскрывается на Blackwell; подходит для reasoning-задач, RAG и промышленных LLM-сервисов, снижая требования к памяти и ускоряя инференс.

Совместимость с диффузионными моделями

Модель	Тип	Совместимость	Примечание
Stable Diffusion XL 1.0	Текст в изображение	✅	Надёжное качество; на 8× RTX PRO 6000 BSE можно параллелить пайплайны, держать большие батчи и стабильную генерацию high-res под CUDA.
Flux.2-dev	Текст в изображение	✅	Требовательна к памяти: удобно распределять нагрузку по нескольким GPU внутри одного сервера; даёт стабильную high-res генерацию и большие батчи на CUDA-стеке.
SD Turbo	Быстрые предпросмотры	✅	Максимальная скорость итераций и серийных кадров; можно запускать несколько параллельных задач (в т.ч. через MIG) для онлайн-предпросмотров и прототипирования.
Kandinsky-5.0-T2I-Lite-sft-Diffusers	Текст в изображение	✅	Лёгкая модель: остаётся большой запас VRAM под высокое разрешение, батчи и одновременную работу нескольких пользователей/пайплайнов на одном узле.
Kandinsky-5.0-T2V-Lite-sft-5s-Diffusers	Текст в видео	✅	Для коротких роликов: удобно масштабировать по нескольким GPU, ускоряя пакетную генерацию видео и серийных кадров на CUDA.

Технические характеристики

Платформа	Supermicro AS-5126GS-TNRT2
Видеокарта	8x NVIDIA RTX PRO 6000 Blackwell Server Edition 96GB GDDR7
Процессор	2x AMD EPYC 9554 (64/128, 3.1GHz-3.75GHz, 360W)
Оперативная память	12x 128GB DDR5 ECC REG Samsung 4800Mhz 4Rx4
SSD накопитель	4x Solidigm D7-PS1010 1.92TB 2.5" U.2 2x Solidigm D7-P5810 800GB 2.5" U.2
Сетевая карта	2x NVIDIA MCX713106AS-VEAT (2x QSFP112 200GBE)

Задать вопрос

Наличие на складах (0 шт.)

Санкт-Петербург, ул. Заозёрная, 8, корп. 2Л

Временно нет в наличии

Доступно бесплатное перемещение с другого склада в течении 1-2 рабочих дней

Москва, 2-я Брестская ул., 39 с4

Временно нет в наличии

Доступно бесплатное перемещение с другого склада в течении 1-2 рабочих дней

Мы отправляем заказы ведущими транспортными компаниями:

CDEK
Деловые линии
ПЭК

Все отправления тщательно упаковываются и скорейшие сроки передаются в ТК.

Ориентировочные сроки сборки заказов:

Серверные комплектующие: 1-2 раб. дня.
Серверы: 1-4 раб. дня.
Перемещение между офисами (МСК-СПБ): 1-2 раб. дня.

В случае если оборудование требуется в срочном порядке сообщите менеджеру и мы организуем приоритетную обработку вашего заказа с учетом выбора тарифа “Экспресс” со стороны ТК.

Оплата заказа доступна после подтверждения менеджером посредством следующих способов оплаты:

Безналичная оплата по счету (для организаций)
Онлайн оплата банковской картой ЮКасса (SberPay, T-Pay, СБП)

Узнать больше

ServerFlow — это интернет магазин специализирующийся на продаже Б/У и новой серверной техники. Все наше оборудование проходит строгий процесс предпродажной подготовки. Мы уделяем большое внимание тестированию всех компонентов, чтобы минимизировать вероятность возникновения гарантийных случаев и обеспечить высокое качество продукции.

Также мы можем предложить расширенный срок гарантийных отношений:

Стандартная гарантия 1 год

входит в стоимость

Расширенная гарантия на 2 года

1 758 620 ₽

Расширенная гарантия на 3 года

2 637 930 ₽

Расширенная гарантия на 4 года

3 517 240 ₽

Расширенная гарантия на 5 лет

4 396 550 ₽

Мы верим, что сможем обеспечить наилучший пользовательский опыт и ценим ваше доверие. Если у вас остались дополнительные вопросы, вы можете адресовать их в онлайн чате на сайте или задать в Telegram @serverflow.

Подробнее об условиях гарантии ServerFlow

ServerFlow активно занимается б/у оборудованием, поэтому мы готовы рассмотреть ваше оборудование в качестве основания для предоставления скидки в рамках “Trade-in”. Чтобы произвести оценку оборудования обратитесь в онлайн чат на сайте или в Telegram @serverflow.

Почему Trade-in в ServerFlow — это удобно:

Оперативная оценка оборудования. Оператор онлайн чата постарается в течении 30 минут дать оценку оборудованию.
Конструктивный диалог. Если вы не согласны с предложенной стоимостью мы постараемся найти компромисс.
Забор оборудования. После согласования Trade-in мы согласуем курьерскую доставку от двери, а если вам удобно лично посетить наш офис в Москве или Санкт-Петербурге.
Тестирование и подтверждение скидки. Технические инженеры ServerFlow проверяет стабильность вашего оборудования. В случае подтверждения стабильности мы утвердим скидку на оборудование.

Скидка 1 500 ₽ за обратную связь

Поделитесь впечатлением о работе ServerFlow после получения заказа.

* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена
бесплатная доставка до ПВЗ СДЭК.

копироватьскопировано

Новый

+200 ₽

Цена с учетом расширенной гарантии

Цена включает НДС 7%

17 586 200 руб.

Под заказ

Узнать сроки доставки

Получить спец. цену Получить КП за час Отправить КП себе на почту