NVIDIA Tesla GPU系列P4、T4、P40以及V100参数性能对比
发布时间:2022-02-08 点击数:8101
一、关于NVIDIA TESLA系列GPU具体介绍如下:
NVIDIA TESLA V100
NVIDIA Tesla V100选用NVIDIA Volta架构,十分适合为要求极为苛刻的双精度核算作业流程供给加快,并且还是从P100晋级的理想途径。该GPU的渲染功能比Tesla P100提升了高达80%,借此可缩短规划周期和上市时刻。
Tesla V100的每个GPU均可供给125 teraflops的推理功能,配有8块Tesla V100的单个服务器可完成1 petaflop的核算功能。
NVIDIA TESLA P40
The Tesla P40能够供给高达2倍的专业图形功能。Tesla P40能够对安排中每个vGPU虚拟化加快图形和核算(NVIDIA CUDA® 和 OpenCL)作业负载。支撑多种行业标准的2U服务器。
Tesla P40可供给出色的推理功能、INT8精度和24GB板载内存。
NVIDIA TESLA T4
NVIDIA Tesla T4的帧缓存高达P4的2倍,功能高达M60的2倍,关于使用NVIDIA Quadro vDWS软件敞开高端3D规划和工程作业流程的用户而言,不失为一种理想的解决方案。凭仗单插槽、半高外形特性以及低至70瓦的功耗,Tesla T4堪称为每个服务器节点完成最大GPU密度的绝佳之选。
NVIDIA TESLA P4
Tesla P4可加快任何外扩型服务器的运转速度,能效高达CPU的60倍。
二、NVIDIA Tesla GPU系列P4、T4、P40以及V100
NVIDIA Tesla系列GPUP4、T4、P40以及V100功能标准参数对比表,阿里云GPU云服务器供给的实例GN4(Nvidia M40)、GN5(Nvidia P100)、GN5i(Nvidia P4)及GN6(Nvidia V100),也会根据NVIDIA Tesla GPU系列。
云服务器 | Tesla T4:世界领先的推理加快器 | Tesla V100:通用数据中心 GPU | 适用于超高效、外扩型服务器的 | Tesla P4 适用于推理吞吐量服务器的 Tesla P40 |
---|---|---|---|---|
单精度功能 (FP32) | 8.1 TFLOPS | 14 TFLOPS (PCIe) 15.7 teraflops (SXM2) | 5.5 TFLOPS | 12 TFLOPS |
半精度功能 (FP16) | 65 TFLOPS | 112 TFLOPS (PCIe)125 TFLOPS (SXM2) | — | — |
整数运算才能 (INT8) | 130 TOPS | — | 22 TOPS* | 47 TOPS* |
整数运算才能 (INT4) | 260 TOPS | — | — | — |
GPU 显存 | 16GB | 32/16GB HBM2 | 8GB | 24GB |
显存带宽 | 320GB/秒 | 900GB/秒 | 192GB/秒 | 346GB/秒 |
体系接口/外形标准 | PCI Express 半高外形 | PCI Express 双插槽全高外形 SXM2/NVLink | PCI Express 半高外形 | PCI Express 双插槽全高外形 |
功率 | 70 W | 250 W (PCIe) 300 W (SXM2) | 50 W/75 W | 250 W |
硬件加快视频引擎 | 1 个解码引擎,2 个编码引擎 | — | 1 个解码引擎,2 个编码引擎 | 1 个解码引擎,2 个编码引擎 |