Цена с учетом расширенной гарантии
Цена включает НДС 7%
Узнать сроки доставки
40-60 раб. дней —
| Тип | Новые |
| Основная задача | Обучение моделей / Инференс / Дообучение моделей / RAG-системы / Анализ данных / Научные расчеты (HPC) |
| Видеокарта (GPU) | NVIDIA H100 |
| Количество GPU, шт | 4 |
| Общий объем видеопамяти (VRAM), ГБ | 376 |
| Тип памяти GPU | HBM3 |
| Объем оперативной памяти (RAM), ГБ | 960 |
| Тип оперативной памяти | LPDDR5x |
| Форм-фактор | 2U |
Supermicro ARS-221GL-NR - это 2U-платформа для инференса / развертывания, RAG-систем, дообучения моделей и научных расчётов. В этой конфигурации используются два встроенных процессора NVIDIA Grace и четыре ускорителя NVIDIA H100 NVL по 94GB, поэтому сервер получает 376GB HBM3 и 960GB ECC LPDDR5X. Такой вариант уже подходит не только для крупных моделей и длинного контекста, но и для распределённого запуска больших LLM на 4 GPU.
Платформа сочетает большой объём видеопамяти и общей памяти системы, поэтому на ней удобно запускать несколько сервисов одновременно, распределять нагрузку между четырьмя GPU или использовать одну систему под несколько моделей. Конфигурация особенно интересна для больших языковых моделей, RAG, генерации изображений и сценариев, где важна высокая производительность без перехода на полноценный кластер.
| Тип точности | Совокупная мощность двух H100 NVL |
| FP8 Tensor Core | 6682 TFLOPS |
| BF16 / FP16 Tensor Core | 3342 TFLOPS |
| TF32 Tensor Core | 1670 TFLOPS |
| FP32 | 120 TFLOPS |
| FP64 Tensor Core | 120 TFLOPS |
| INT8 Tensor Core | 6682 TOPS |
| Модель | Тип квантизации | Требуется VRAM | Совместимость | Примечание |
| DeepSeek-R1-Distill-Llama-70B | Нет | Примерно 141GB | ✅ | Уверенно работает на этой системе и оставляет большой запас памяти под длинный контекст и несколько параллельных запросов. |
| Qwen3.5-122B-A10B | Нет | Примерно 250GB | ✅ | Подходит для запуска на 4 GPU и позволяет держать стабильную работу даже при длинном контексте и высокой нагрузке. |
| gpt-oss-120b | Нет | Примерно 196GB | ✅ | Удобный вариант для этой конфигурации - остаётся запас памяти под рабочий контекст, дополнительные сервисы и параллельные задачи. |
| GLM-4.7-FP8 | FP8 | Примерно 362GB | ✅ | Практически полностью использует доступную видеопамять, поэтому лучше держать умеренный контекст и не перегружать систему дополнительными задачами. |
| Модель | Тип | Совместимость | Примечание |
| stable-diffusion-3.5-medium | Текст в изображение | ✅ | Подходит для генерации изображений в высоком разрешении и удобной параллельной работы сразу на четырёх GPU. |
| FLUX.2-dev | Текст в изображение | ✅ | Требовательная модель, но на этой конфигурации её удобно распределять между четырьмя GPU для более быстрой и стабильной генерации. |
| SD Turbo | Быстрые предпросмотры | ✅ | Подходит для быстрых итераций, серийной генерации и большого числа одновременных задач. |
| Kandinsky-5.0-T2I-Lite-sft-Diffusers | Текст в изображение | ✅ | Лёгкая модель для этой платформы - можно держать высокое разрешение, большие батчи и несколько процессов одновременно. |
| Kandinsky-5.0-T2V-Lite-sft-5s-Diffusers | Текст в видео | ✅ | Подходит для коротких роликов и пакетной обработки с распределением нагрузки между четырьмя GPU. |
| Платформа | Supermicro ARS-221GL-NR |
| Видеокарта | 4x NVIDIA H100 NVL 94GB HBM3 |
| Процессор | 2x NVIDIA Grace |
| Оперативная память | 480GB LPDDR5X |
| SSD накопитель | 8x E1.S NVMe
2x M.2 NVMe (M-key) |
Мы отправляем заказы ведущими транспортными компаниями:
Все отправления тщательно упаковываются и скорейшие сроки передаются в ТК.
Ориентировочные сроки сборки заказов:
В случае если оборудование требуется в срочном порядке сообщите менеджеру и мы организуем приоритетную обработку вашего заказа с учетом выбора тарифа “Экспресс” со стороны ТК.
Оплата заказа доступна после подтверждения менеджером посредством следующих способов оплаты:
ServerFlow — это интернет магазин специализирующийся на продаже Б/У и новой серверной техники. Все наше оборудование проходит строгий процесс предпродажной подготовки. Мы уделяем большое внимание тестированию всех компонентов, чтобы минимизировать вероятность возникновения гарантийных случаев и обеспечить высокое качество продукции.
Также мы можем предложить расширенный срок гарантийных отношений:
Мы верим, что сможем обеспечить наилучший пользовательский опыт и ценим ваше доверие. Если у вас остались дополнительные вопросы, вы можете адресовать их в онлайн чате на сайте или задать в Telegram @serverflow.
ServerFlow активно занимается б/у оборудованием, поэтому мы готовы рассмотреть ваше оборудование в качестве основания для предоставления скидки в рамках “Trade-in”. Чтобы произвести оценку оборудования обратитесь в онлайн чат на сайте или в Telegram @serverflow.
Почему Trade-in в ServerFlow — это удобно:
Поделитесь впечатлением о работе ServerFlow после получения заказа.
* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена
бесплатная доставка до ПВЗ СДЭК.
Цена включает НДС 7%
Узнать сроки доставки
40-60 раб. дней —
Мы ценим обратную связь от клиентов. При оформлении заказа вы можете сообщить о своём намерении поделиться впечатлением о работе ServerFlow после получения товара.
* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка до ПВЗ СДЭК.