Цена с учетом расширенной гарантии
Цена включает НДС 7%
Узнать сроки доставки
40-60 раб. дней —
| Тип | Новые |
| Основная задача | Обучение моделей / Инференс / Дообучение моделей / RAG-системы / Визуализация и рендеринг |
| Процессор (CPU) | AMD EPYC |
| Видеокарта (GPU) | NVIDIA RTX PRO 6000 Blackwell |
| Количество GPU, шт | 8 |
| Общий объем видеопамяти (VRAM), ГБ | 768 |
| Тип памяти GPU | GDDR7 |
| Объем оперативной памяти (RAM), ГБ | 1536 |
| Тип оперативной памяти | DDR5 ECC REG |
| Форм-фактор | 4U |
ASUS ESC8000A-E13P с 8× NVIDIA RTX PRO 6000 Blackwell Server Edition по 96GB (суммарно 768GB VRAM) - это мощная платформа для Инференса / Развертывания (Inference), RAG-систем (Retrieval-Augmented Generation), Дообучения моделей (Fine-tuning) и Обучения моделей (Training) в multi-GPU конфигурациях, когда важны большой общий объём видеопамяти и высокая пропускная способность GPU-узлов.
RTX PRO 6000 Blackwell Server Edition использует архитектуру Blackwell и память 96GB GDDR7 с ECC на каждую карту, а также Tensor Cores с поддержкой FP4 (актуально для ускорения современных LLM-нагрузок и снижения требований к памяти при инференсе).
Сервер также отлично подходит для Визуализации и рендеринга и Видеоаналитики / Видеонаблюдения (в т.ч. многопоточные пайплайны детекции/трекинга/segmentation), потому что это RTX-платформа с акцентом на AI + графику/RT-задачи.
Ограничения и нюансы: эффективность масштабирования Training/Fine-tuning зависит от стека (PyTorch/vLLM/TensorRT), стратегии параллелизма (tensor/pipeline/data) и межсоединения (в серверном варианте - PCIe Gen5). Поэтому большие модели чаще запускают в распределённом режиме, а “в одну карту” - только то, что помещается в 96GB.
| Тип точности | Совокупная мощность восьми RTX PRO 6000 BSE |
| FP32 | 960 TFLOPS |
| FP4 | 32 PFLOPS |
| RT Core performance* | 2840 TFLOPS |
*-RT Core performance - это пиковая производительность специализированных RT-ядер (Ray Tracing Cores), которые аппаратно ускоряют операции трассировки лучей (поиск пересечений луча с геометрией и обход BVH). Показатель важен для визуализации/рендеринга и некоторых графических/3D-пайплайнов, но не является прямым аналогом FP32/AI-производительности.
| Модель | Тип квантизации | Требуется VRAM | Совместимость | Примечание |
| DeepSeek-R1 685B | Нет | Примерно 689GB | ✅ | Запуск на 8×96GB (768GB суммарно) в multi-GPU через vLLM/TensorRT-LLM; подходит для reasoning и длинного контекста. |
| Qwen3-235B-A22B-Instruct | Нет | Примерно 471GB | ✅ | Комфортный multi-GPU инференс на одном узле; чаты, агенты и RAG под высокой нагрузкой. |
| Gpt-oss:120b | Нет | Примерно 196GB | ✅ | Без квантизации; можно держать несколько реплик/сервисов параллельно благодаря 768GB VRAM. |
| GigaChat3-702B-A36B-preview | Нет | Примерно 720GB | ✅ | Помещается на 8×96GB; запуск в multi-GPU для крупных ассистентов и длинных диалогов. |
| Mistral-Large-3-675B-Instruct-251 | Нет | Примерно 682GB | ✅ | Multi-GPU на одном узле; хороша для аналитики, RAG и агентных сценариев. |
| GLM-4.7-FP8 | FP8 | Примерно 362GB | ✅ | FP8 снижает VRAM и ускоряет инференс; удобно для продакшн LLM и RAG-сервисов. |
| Модель | Тип | Совместимость | Примечание |
| Stable Diffusion XL 1.0 | Текст в изображение | ✅ | High-res генерация и батчи; легко распараллелить очереди на 8 GPU (CUDA). |
| Flux.2-dev | Текст в изображение | ✅ | Тяжёлые пайплайны удобно распределять по GPU; уверенная high-res генерация на CUDA. |
| SD Turbo | Быстрые предпросмотры | ✅ | Очень быстрые итерации; много параллельных предпросмотров и массовая генерация. |
| Kandinsky-5.0-T2I-Lite-sft-Diffusers | Текст в изображение | ✅ | Лёгкая модель: запас VRAM под high-res, батчи и одновременную работу пользователей. |
| Kandinsky-5.0-T2V-Lite-sft-5s-Diffusers | Текст в видео | ✅ | Короткие ролики: масштабирование по GPU ускоряет пакетную генерацию видео и кадров. |
| Платформа | ASUS ESC8000A-E13P |
| Видеокарта | 8x NVIDIA RTX PRO 6000 Blackwell Server Edition 96GB GDDR7 |
| Процессор | 2x AMD EPYC 9845 (160c/320t, 2.1GHz-3.7GHz, 390W) |
| Оперативная память | 24x 64GB DDR5 ECC REG Samsung 6400Mhz 2Rx4 |
| SSD накопитель | 4x Kioxia CM6-R 7.68TB 2.5" U.3 |
| Сетевая карта | 1x Mellanox MCX755106AS-HEAT (2x QSFP112, 200GBE) |
Мы отправляем заказы ведущими транспортными компаниями:
Все отправления тщательно упаковываются и скорейшие сроки передаются в ТК.
Ориентировочные сроки сборки заказов:
В случае если оборудование требуется в срочном порядке сообщите менеджеру и мы организуем приоритетную обработку вашего заказа с учетом выбора тарифа “Экспресс” со стороны ТК.
Оплата заказа доступна после подтверждения менеджером посредством следующих способов оплаты:
ServerFlow — это интернет магазин специализирующийся на продаже Б/У и новой серверной техники. Все наше оборудование проходит строгий процесс предпродажной подготовки. Мы уделяем большое внимание тестированию всех компонентов, чтобы минимизировать вероятность возникновения гарантийных случаев и обеспечить высокое качество продукции.
Также мы можем предложить расширенный срок гарантийных отношений:
Мы верим, что сможем обеспечить наилучший пользовательский опыт и ценим ваше доверие. Если у вас остались дополнительные вопросы, вы можете адресовать их в онлайн чате на сайте или задать в Telegram @serverflow.
ServerFlow активно занимается б/у оборудованием, поэтому мы готовы рассмотреть ваше оборудование в качестве основания для предоставления скидки в рамках “Trade-in”. Чтобы произвести оценку оборудования обратитесь в онлайн чат на сайте или в Telegram @serverflow.
Почему Trade-in в ServerFlow — это удобно:
Оставьте отзыв о ServerFlow на Яндексе и условия акции будут исполнены
* скидка предоставляется при покупке от 30 000 рублей,
в ином случае предусмотрена бесплатная доставка.
Цена включает НДС 7%
Узнать сроки доставки
40-60 раб. дней —
Мы ценим вашу обратную связь.
После покупки оставьте отзыв о ServerFlow на Яндексе и условия акции будут исполнены.
* — скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка.