Почему нет цен?
Уточнить цену Гарантия до 5 лет
Диагностика перед отправкой
Присылайте спецификацию для подбора и расчета стоимости оборудования
Подключим и настроим оборудование в вашем офисе или ЦОДе
NVIDIA L40S 48GB — это универсальный тензорно-графический ускоритель дата-центрового класса на архитектуре NVIDIA Ada Lovelace, разработанный для генеративного ИИ, инференса крупных языковых моделей (LLM), обучения нейросетей, визуализации и высокопроизводительных вычислений (HPC). В официальном описании L40S GPU for AI and Graphics Performance карта позиционируется как «The Most Powerful Universal GPU», обеспечивающая прорывную многозадачную производительность для генеративного ИИ, LLM‑инференса и обучения, графики и видео. Согласно PNY NVIDIA L40S Datasheet и Lenovo ThinkSystem NVIDIA L40S 48GB PCIe Gen4 Passive GPU Product Guide, ускоритель оснащён 48 ГБ GDDR6 с поддержкой ECC, интерфейсом PCIe Gen4 x16 и реализован в формате полноразмерной двухслотовой пассивной карты FHFL (4,4" × 10,5").
Технические характеристики L40S включают 18 176 CUDA‑ядер, 568 тензорных ядер четвёртого поколения и 142 RT‑ядра третьего поколения, что подтверждается в сводках Cyfuture и Lenovo. Пиковая производительность FP32 оценивается примерно в 91,6 TFLOPS, TF32 Tensor Core — до 183 / 366 TFLOPS (без / с учётом sparsity), BFLOAT16 / FP16 Tensor Core — до 362 / 733 TFLOPS, FP8 Tensor Core — до 733 TFLOPS (со sparsity), а INT8 Tensor Core — до 1466 TOPS. В PNY L40S Datasheet и Lenovo Product Guide также указывается пропускная способность памяти 864 GB/s при использовании 48 GB GDDR6 с ECC и 384‑битной шины памяти. Форм‑фактор и энергетика: PCIe Gen4 x16, пассивное охлаждение, двухслотовая полноразмерная карта с максимальной мощностью платы порядка 300 W.
Архитектура NVIDIA L40S 48GB основана на NVIDIA Ada Lovelace и ориентирована на многопрофильные нагрузки: генеративный ИИ, LLM‑инференс, обучение нейросетей, визуализацию и графику. В таблицах Cyfuture и HorizonIQ указано: 18 176 CUDA Cores, 568 Tensor Cores (4‑го поколения) и 142 RT Cores (3‑го поколения), что обеспечивает сочетание высокой шейдерной, тензорной и рейтрейсинговой производительности. Пиковая производительность FP32 составляет примерно 91,6 TFLOPS, RT Core performance — около 209 TFLOPS, TF32 Tensor Core — 183 / 366 TFLOPS, BFLOAT16/FP16 Tensor Core — 362,05 / 733 TFLOPS, FP8 Tensor Core — до 733 TFLOPS, а INT8 Tensor Core — до 1466 TOPS (значения с учётом sparsity отмечены звёздочкой).
Подсистема памяти NVIDIA L40S реализована на базе 48 GB GDDR6 с ECC. В PNY L40S Datasheet и Lenovo ThinkSystem L40S Product Guide указано: GPU Memory 48GB GDDR6 with ECC, Memory Bandwidth 864 GB/s, Memory Interface 384‑bit. Интерфейс подключения — PCIe Gen4 x16 с пропускной способностью 64 GB/s в каждом направлении, что отражено в документации Lenovo и партнёрских даташитах. Форм‑фактор: PCIe Full Height Full Length adapter (4.4‑in x 10.5‑in), double‑width (dual slot), NVIDIA Form Factor 5.5, пассивное охлаждение. В документации также указываются четыре DisplayPort 1.4a с поддержкой Display Stream Compression и разрешений до 4K 120 Hz на порт, а также поддержка графических API: DirectX 12 Ultimate, Shader Model 6.6, OpenGL 4.6, Vulkan 1.3 и вычислительных API: CUDA 12.0, DirectCompute, OpenCL 3.0.
С точки зрения архитектурных возможностей для ИИ, L40S использует тензорные ядра четвёртого поколения, оптимизированные под FP8, FP16, BF16, TF32 и FP32, с поддержкой sparsity, что позволяет существенно ускорять обучение и инференс нейросетей. В описании NVIDIA L40S GPU for AI and Graphics Performance подчёркивается, что ускоритель обеспечивает «breakthrough multi‑workload acceleration» для генеративного ИИ, LLM‑инференса и обучения, графики и видео. Lenovo в Product Guide указывает, что L40S — это «powerful universal GPU for the data center, delivering breakthrough multi‑workload acceleration for Generative AI and large language model (LLM) inference and training, graphics, and video applications». Это подтверждает ориентацию архитектуры L40S на объединённые GPU‑нагрузки в одном решении.
По энергопотреблению и интеграции L40S рассчитан на максимальную мощность платы около 300 W, что требует серверных платформ с адекватным запасом по питанию и продуманной системой воздушного охлаждения для пассивных ускорителей. В документации Lenovo и PNY указываются требования к серверным шасси (наличие FHFL слотов, поддержка двухслотовых карт, достаточная вентиляция) и рекомендации по использованию L40S в многокарточных конфигурациях. Это делает L40S подходящим для масштабируемых AI‑кластеров на базе стандартных серверов с PCIe Gen4.

NVIDIA L40S 48GB позиционируется как универсальный GPU для генеративного ИИ, LLM‑инференса и обучения, а также для визуализации, рендеринга и видео в дата‑центрах. Официальное позиционирование подчёркивает, что L40S обеспечивает многопрофильное ускорение (multi‑workload acceleration) для AI, graphics и video workloads в рамках одной карты.
NVIDIA L40S 48GB разработан для интеграции в серверные платформы с поддержкой полноразмерных двухслотовых PCIe Gen4 GPU, пассивного охлаждения и входит в программу NVIDIA‑Certified Systems, что подтверждает его совместимость с широким спектром OEM‑серверов. В таблице NVIDIA‑Certified Systems указаны системы разных производителей (HPE, Nutanix/Dell, Supermicro и др.), в которых L40S проходит официальное тестирование на совместимость и производительность.
При интеграции NVIDIA L40S в сервер необходимо учитывать форм‑фактор FHFL dual‑slot (4,4" × 10,5"), интерфейс PCIe Gen4 x16, пассивное охлаждение и максимальную мощность около 300 W, что требует наличия соответствующих слотов, воздушного потока и блока питания. В документации Lenovo и партнёров описаны требования к размещению карт, ограничения по количеству GPU на узел, минимальные параметры БП и особенности компоновки (двухслотовая толщина, высота/длина, требования к вентиляции), что важно для плотных многокарточных конфигураций.
NVIDIA L40S 48GB поддерживает стандартный стек программного обеспечения NVIDIA для дата‑центров: CUDA 12, cuDNN, TensorRT, а также SDK и библиотеки для рендеринга, ИИ и визуализации, включая Omniverse, RTX и средства для работы с цифровыми двойниками. В сочетании с поддержкой vGPU (по данным vGPU L40 datasheet), это позволяет использовать L40S как в «bare metal» конфигурациях, так и в виртуализированных средах, распределяя ресурсы GPU между множеством пользователей и сервисов.
Благодаря архитектуре Ada, 48GB GDDR6 с ECC, 18 176 CUDA‑ядрам, 568 тензорным ядрам, 142 RT‑ядрам, интерфейсу PCIe Gen4 x16, пассивному FHFL‑форм‑фактору и наличию сертификаций NVIDIA‑Certified Systems, NVIDIA L40S 48GB выступает универсальным ускорителем для дата‑центров, ориентированных на генеративный ИИ, инференс LLM‑моделей, обучение нейросетей, прикладные HPC‑задачи и профессиональную визуализацию на серверных платформах Dell, HPE, Supermicro и других OEM‑производителей.
Обратитесь к специалистам компании KVANTECH
