GIGABYTE G494-ZB4-AAP2 (8× RTX PRO 6000 BSE 96GB, 2× EPYC 9655, RAM 768GB)

Name: GIGABYTE G494-ZB4-AAP2 (8× RTX PRO 6000 BSE 96GB, 2× EPYC 9655, RAM 768GB)
Brand: GIGABYTE
Price: 13950400 RUB
Availability: PreOrder

GIGABYTE G494-ZB4-AAP2 (8× RTX PRO 6000 BSE 96GB, 2× EPYC 9655, RAM 768GB) 1

GIGABYTE G494-ZB4-AAP2 (8× RTX PRO 6000 BSE 96GB, 2× EPYC 9655, RAM 768GB) 2

GIGABYTE G494-ZB4-AAP2 (8× RTX PRO 6000 BSE 96GB, 2× EPYC 9655, RAM 768GB) 3

GIGABYTE G494-ZB4-AAP2 (8× RTX PRO 6000 BSE 96GB, 2× EPYC 9655, RAM 768GB) 4

GIGABYTE G494-ZB4-AAP2 (8× RTX PRO 6000 BSE 96GB, 2× EPYC 9655, RAM 768GB) 5

GIGABYTE G494-ZB4-AAP2 (8× RTX PRO 6000 BSE 96GB, 2× EPYC 9655, RAM 768GB) 6

GIGABYTE G494-ZB4-AAP2 (8× RTX PRO 6000 BSE 96GB, 2× EPYC 9655, RAM 768GB) 7

Новый

+200 ₽

Цена с учетом расширенной гарантии

Цена включает НДС 7%

13 950 400 руб.

Под заказ

Узнать сроки доставки

Получить спец. цену Получить КП за час Отправить КП себе на почту

добавить В корзину

Сравнить

Гарантия 1 год с заменой компонентов

Доставка СДЭК и ведущими службами доставки

Тестируем оборудование
перед отправкой

Гарантия 1 год с заменой компонентов

Подробнее

Условия доставки и самовывоза

Подробнее

Помощь в вопросе выбора и совместимости

Подробнее

Характеристики Доставка и оплата Гарантия Отзывы Trade In

Спецификация GIGABYTE G494-ZB4-AAP2.pdf

Тип	Новые
Основная задача	Обучение моделей / Инференс / Дообучение моделей / RAG-системы / Визуализация и рендеринг
Процессор (CPU)	AMD EPYC
Видеокарта (GPU)	NVIDIA RTX PRO 6000 Blackwell
Количество GPU, шт	8
Общий объем видеопамяти (VRAM), ГБ	768
Тип памяти GPU	GDDR7
Объем оперативной памяти (RAM), ГБ	768
Тип оперативной памяти	DDR5 ECC REG
Форм-фактор	4U

Подробные характеристики

Подробное описание

Этот сервер - высокоплотная 4U-платформа под 8 GPU для Инференс / Развертывание (Inference) и RAG-системы (Retrieval-Augmented Generation): можно держать несколько крупных LLM одновременно, обслуживать много пользователей/проектов и масштабировать скорость за счёт параллелизма по GPU.

Каждая NVIDIA RTX PRO 6000 Blackwell Server Edition имеет 96 GB GDDR7 (ECC) и рассчитана на дата-центр: PCIe Gen5, пассивное охлаждение, поддержка FP4 (ускорение LLM-инференса на Tensor Cores), а также мощные видео-движки NVENC/NVDEC - полезно для Видеоаналитика / Видеонаблюдение и мультимодальных пайплайнов.

Суммарно у вас 768 GB VRAM (8 × 96 GB GDDR7) - это уровень, где комфортно живут “очень большие” модели в квантизации и тяжёлые генеративные/видео-задачи. Важно: в этой платформе видеовыходы GPU недоступны, а для 600W GPU требуется соответствующая вентиляция/опциональный fan kit и серьёзный запас по питанию.

Производительность GPU

Тип точности	Совокупная мощность восьми RTX PRO 6000 BSE
FP32	960 TFLOPS
FP4	32 PFLOPS
RT Core performance*	2840 TFLOPS

*-RT Core performance - это пиковая производительность специализированных RT-ядер (Ray Tracing Cores), которые аппаратно ускоряют операции трассировки лучей (поиск пересечений луча с геометрией и обход BVH). Показатель важен для визуализации/рендеринга и некоторых графических/3D-пайплайнов, но не является прямым аналогом FP32/AI-производительности.

Совместимость с LLM-моделями

Модель	Тип квантизации	Требуется VRAM	Совместимость	Примечание
DeepSeek-R1 685B	Нет	Примерно 689GB	✅	Запуск на одном узле 8× RTX PRO 6000 BSE (768GB VRAM) через multi-GPU распределение (tensor/pipeline parallel) в vLLM или TensorRT-LLM; сильна в reasoning, хорошо держит длинный контекст и сложные многошаговые цепочки.
Qwen3.5-397B-A17B-FP8	FP8	Примерно 406GB	✅	Комфортно масштабируется по 8 GPU внутри одного сервера; оптимальный кандидат для продакшн-чатов, агентных сценариев и RAG с высоким QPS, длинными диалогами и несколькими параллельными сессиями.
Gpt-oss:120b	Нет	Примерно 196GB	✅	Работает «в полный рост» на одном сервере без квантизации; запас VRAM позволяет держать увеличенный контекст, высокий batch и запускать несколько реплик/микросервисов параллельно под продакшн-нагрузку.
GigaChat3-702B-A36B-preview	Нет	Примерно 720GB	✅	Помещается на 8×96GB с multi-GPU (tensor/pipeline parallel); подходит для крупных ассистентов и RAG с длинным контекстом, а также для нескольких одновременных потоков инференса в одном узле.
Mistral-Large-3-675B-Instruct-251	Нет	Примерно 682GB	✅	Рациональный выбор для аналитики и reasoning при запуске на 8 GPU; удобна для агентных пайплайнов и RAG, где важны длинные промпты/контекст и стабильный throughput.
GLM-5-FP8	FP8	Примерно 756GB	✅	FP8-режим особенно эффективен на Blackwell: ниже требования к памяти при высокой скорости; хорошо подходит для промышленных LLM-сервисов, reasoning и RAG, когда важны throughput и стоимость запроса.

Совместимость с диффузионными моделями

Модель	Тип	Совместимость	Примечание
Stable Diffusion XL 1.0	Текст в изображение	✅	Стабильная «рабочая лошадка» для продакшна: на 8× RTX PRO 6000 BSE удобно параллелить пайплайны, держать большие батчи и high-res генерацию с предсказуемым качеством на CUDA.
Flux.2-dev	Текст в изображение	✅	Требовательна к VRAM и пропускной способности: лучше раскрывается при распределении очереди по нескольким GPU; даёт уверенную high-res генерацию и крупные батчи, удобна для массового контента.
SD Turbo	Быстрые предпросмотры	✅	Максимальная скорость итераций: можно запускать много параллельных задач (включая изоляцию через MIG, если включено) для онлайн-предпросмотров, A/B-прототипирования и серийной генерации кадров.
Kandinsky-5.0-T2I-Lite-sft-Diffusers	Текст в изображение	✅	Лёгкая и быстрая: остаётся большой запас VRAM под высокие разрешения, апскейл, батчи и одновременную работу нескольких пользователей/пайплайнов на одном узле.
Kandinsky-5.0-T2V-Lite-sft-5s-Diffusers	Текст в видео	✅	Для коротких роликов и серийных кадров: удобно масштабировать по нескольким GPU, ускоряя пакетную генерацию видео и стабилизируя throughput в продакшн-очереди.

Технические характеристики

Платформа	GIGABYTE G494-ZB4-AAP2
Видеокарта	8x NVIDIA RTX PRO 6000 Blackwell Server Edition 96GB GDDR7
Процессор	2x AMD EPYC 9655 (96c/192t, 2.6GHz-4.5GHz, 400W)
Оперативная память	12x 64GB DDR5 ECC REG Samsung 5600Mhz 2Rx4
SSD накопитель	4x Solidigm D7-PS1030 3.2TB 2.5" U.2

Задать вопрос

Наличие на складах (0 шт.)

Санкт-Петербург, ул. Заозёрная, 8, корп. 2Л

Временно нет в наличии

Доступно бесплатное перемещение с другого склада в течении 1-2 рабочих дней

Москва, 2-я Брестская ул., 39 с4

Временно нет в наличии

Доступно бесплатное перемещение с другого склада в течении 1-2 рабочих дней

Мы отправляем заказы ведущими транспортными компаниями:

CDEK
Деловые линии
ПЭК

Все отправления тщательно упаковываются и скорейшие сроки передаются в ТК.

Ориентировочные сроки сборки заказов:

Серверные комплектующие: 1-2 раб. дня.
Серверы: 1-4 раб. дня.
Перемещение между офисами (МСК-СПБ): 1-2 раб. дня.

В случае если оборудование требуется в срочном порядке сообщите менеджеру и мы организуем приоритетную обработку вашего заказа с учетом выбора тарифа “Экспресс” со стороны ТК.

Оплата заказа доступна после подтверждения менеджером посредством следующих способов оплаты:

Безналичная оплата по счету (для организаций)
Онлайн оплата банковской картой ЮКасса (SberPay, T-Pay, СБП)

Узнать больше

ServerFlow — это интернет магазин специализирующийся на продаже Б/У и новой серверной техники. Все наше оборудование проходит строгий процесс предпродажной подготовки. Мы уделяем большое внимание тестированию всех компонентов, чтобы минимизировать вероятность возникновения гарантийных случаев и обеспечить высокое качество продукции.

Также мы можем предложить расширенный срок гарантийных отношений:

Стандартная гарантия 1 год

входит в стоимость

Расширенная гарантия на 2 года

1 395 040 ₽

Расширенная гарантия на 3 года

2 092 560 ₽

Расширенная гарантия на 4 года

2 790 080 ₽

Расширенная гарантия на 5 лет

3 487 600 ₽

Мы верим, что сможем обеспечить наилучший пользовательский опыт и ценим ваше доверие. Если у вас остались дополнительные вопросы, вы можете адресовать их в онлайн чате на сайте или задать в Telegram @serverflow.

Подробнее об условиях гарантии ServerFlow

ServerFlow активно занимается б/у оборудованием, поэтому мы готовы рассмотреть ваше оборудование в качестве основания для предоставления скидки в рамках “Trade-in”. Чтобы произвести оценку оборудования обратитесь в онлайн чат на сайте или в Telegram @serverflow.

Почему Trade-in в ServerFlow — это удобно:

Оперативная оценка оборудования. Оператор онлайн чата постарается в течении 30 минут дать оценку оборудованию.
Конструктивный диалог. Если вы не согласны с предложенной стоимостью мы постараемся найти компромисс.
Забор оборудования. После согласования Trade-in мы согласуем курьерскую доставку от двери, а если вам удобно лично посетить наш офис в Москве или Санкт-Петербурге.
Тестирование и подтверждение скидки. Технические инженеры ServerFlow проверяет стабильность вашего оборудования. В случае подтверждения стабильности мы утвердим скидку на оборудование.

Скидка 1 500 ₽ за обратную связь

Поделитесь впечатлением о работе ServerFlow после получения заказа.

* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена
бесплатная доставка до ПВЗ СДЭК.

копироватьскопировано

Новый

+200 ₽

Цена с учетом расширенной гарантии

Цена включает НДС 7%

13 950 400 руб.

Под заказ

Узнать сроки доставки

Получить спец. цену Получить КП за час Отправить КП себе на почту