Tilda Publishing
Привет, любопытный друг. Да, это Tilda. Потому что мы хотим быстро внедрять и управлять решением, а не ждать
в очереди разработчика. Контроль, предсказуемость и отказоустойчивость — наша главная идея.
Подберём типовое или произведем на заказ серверное оборудование, предоставим расчёт и поможем интегрировать в систему.

Заполните форму запроса слева или отправьте описание вашей задачи на почту get@work-system.ru

При отправке письма на почту укажите номер телефона вашего специалиста для обсуждения аналогов оборудования в случае необходимости

NVIDIA HGX H800 8-GPU

GPU-сервер на платформе NVIDIA HGX H800 предназначен для ресурсоёмких задач искусственного интеллекта, обучения глубоких нейронных сетей и высокопроизводительных вычислений (HPC). Система оптимизирована для обработки больших языковых моделей (LLM), генеративного ИИ и аналитики больших данных. Восемь ускорителей NVIDIA H800 на архитектуре Hopper объединены высокоскоростным интерконнектом NVLink, что обеспечивает эффективное масштабирование многопроцессорных рабочих нагрузок. Сервер ориентирован на дата-центры и исследовательские организации, требующие максимальной вычислительной плотности.

Преимущества модели

– Восемь GPU NVIDIA H800 SXM5 по 80 ГБ памяти HBM3 каждый, суммарно 640 ГБ GPU-памяти для обработки крупномасштабных моделей.

– Полносвязная топология NVLink через четыре микросхемы NVSwitch третьего поколения обеспечивает прямой обмен данными между всеми GPU внутри узла.

– Тензорные ядра четвёртого поколения и Transformer Engine с поддержкой FP8 ускоряют обучение и инференс трансформерных архитектур.

– Поддержка технологии Multi-Instance GPU (MIG) второго поколения для безопасной изоляции рабочих нагрузок в многопользовательских средах.

Комплектация

– Базовая плата NVIDIA HGX (Delta-Next) с восемью GPU H800 80GB SXM5.

– Четыре NVSwitch третьего поколения.

– Доступны варианты воздушного и жидкостного охлаждения.

– Серверные шасси поставляются партнёрами (Supermicro SYS-821GE-TNHR, Dell, Lenovo) с процессорами, памятью и сетевыми адаптерами.

Совместимость и монтаж

Система устанавливается в стандартную 19-дюймовую стойку в форм-факторе 8U (на примере Supermicro SYS-821GE-TNHR). Поддерживаются двухпроцессорные конфигурации на базе Intel Xeon Scalable 4-го/5-го поколения с 32 слотами DDR5 (до 8 ТБ оперативной памяти). Интерфейс PCIe Gen5 обеспечивает высокую пропускную способность для сетевых адаптеров 400G и накопителей NVMe.

Максимальная частота GPU
2.505 ГГц

Ширина шины памяти
5120 бит

Максимальная мощность TDP
700 Вт (за GPU) / 350-700 Вт (конфигурируется)

NVLink (за GPU)
900 ГБ/с (четвёртое поколение)

NVLink конфигурация
12 NVLink соединений на GPU для полносвязной топологии

Поддержка Transformer Engine
Да (FP8 / FP16 смешанная точность)

Поддержка спектра структурированной разреженности
2:4 спектр (удваивает эффективную пропускную способность)

Динамическое переключение частоты
Поддерживается

PCIe интерфейс
PCIe Gen 5.0 x16 (128 ГБ/с)

NVSwitch интеграция
Требуется для полносвязной топологии (900 ГБ/с GPU-to-GPU)

Media Engine
7x NVDEC (видеодекодер), 7x NVENC (видеокодер), 7x JPEG (JPEG кодер-декодер)

CUDA Compute Capability
9.0

Multi-Instance GPU (MIG)
До 7 независимых GPU экземпляров на GPU (10 ГБ на экземпляр)

Шифрование памяти
Поддерживается

Поддержка ECC память
Поддерживается

Поддержка DPX инструкций
Да (ускоренные динамические алгоритмы программирования)

Поддержка Tensor Float 32
Да

Конфиденциальное вычисление NVIDIA
Поддерживается

Максимальное потребление системы
~5.6 кВт (8 × 700 Вт GPU) или ~2.8 кВт (8 × 350 Вт минимум)

Общее потребление системы (с CPU, памятью, сетью)
~10-11 кВт

Блоки питания
Конфигурируется (зависит от платформы)

Форм-фактор
8-way HGX

Физический размер HGX базовой платы
Стандартный HGX форм-фактор

Типичная высота сервера
4-8U (в зависимости от конфигурации охлаждения)

Охлаждение
Воздушное или жидкостное (рекомендуется жидкостное для полной производительности)

Диапазон рабочей температуры
5°C до 30°C (рекомендуется)

Количество декодеров видео
7 независимых NVDEC (одновременное декодирование)

Интегрированный Transformer Engine
Да (ускоряет трансформаторные модели через FP8)

Поддержка куантизации
FP64, FP32, TF32, BF16, FP16, FP8, INT8

Поддержка потоковой передачи данных
Поддерживается через NVLink и PCIe Gen 5.0

Поддержка виртуализации
KVM, Docker, Kubernetes, NVIDIA vGPU

Поддержка контейнеризации
NVIDIA Container Toolkit

CUDA версия
CUDA 11+ (CUDA 12+ рекомендуется)

Операционные системы
Ubuntu Linux, Red Hat Enterprise Linux, Rocky Linux, CentOS

Базовое программное обеспечение
NVIDIA DGX OS (если в конфигурации DGX) или пользовательская ОС

Поддерживаемые фреймворки
PyTorch, TensorFlow, JAX, MXNet

Платформы вывода
TensorRT 8+, ONNX Runtime, vLLM, Text Generation WebUI

Специализированные библиотеки
RAPIDS, CUDA-X, cuDNN, cuBLAS, nccl

Утилиты для управления
NVIDIA-SMI, DCGM (Data Center GPU Manager), NVIDIA DGX Management Console

Тип памяти GPU
HBM2e (High Bandwidth Memory 2e)

Рекомендуемая системная память
2-4 ТБ DDR5 или DDR4 (в зависимости от платформы)

Поддержка SR-IOV
Да (для виртуализации)

Поддержка RDMA
Требуется сетевой адаптер ConnectX-6/7/8

Поддержка MPI
Через NVIDIA NCCL 2+ и MPI поверх InfiniBand/Ethernet

Стандартная конфигурация сети
3.2 Тб/с общей пропускной способности (8 GPU × 400 Гб/с)

Общая пропускная способность NVLink (8 GPU)
7.2 ТБ/с (900 ГБ/с × 8 GPU, максимум)

Общая пропускная способность памяти (8 GPU)
16 ТБ/с (2 ТБ/с × 8 GPU)

Возможность хранения (типичная)
До 30+ ТБ NVMe (конфигурируется через U.3 или M.2 приводы)

Интерфейс хранения
PCIe Gen 4/5

Поддерживаемые конфигурации RAID
RAID 0, 1, 5, 6, 10 (зависит от сервера-партнёра)

Поддержка виртуальных GPU
H800-80C (C-series vGPU) для мультитенантности
Похожие серверы