NVIDIA TESLA GPU 运算卡 K40C
NVIDIA的GK110核心早就是用于Tesla产品线的,不过去年发布的Tesla K20X及K20只启用了GK110核心的14组、13组SMX单元,而完整版GK110拥有15组SMX单元,2880个CUDA核心,今年早用于Quadro K6000专业卡,前不久消费级的GeForce GTX 780 Ti也用上了2880核心的GK110,现在终于轮到Tesla产品线了。NVIDIA日前正式发布了2880核心的Tesla K40加速卡,配备的显存容量也翻倍到12GB,跟AMD刚刚发布的FirePro S10000 12GB一样。
与目前的Tesla K20X相比,Tesla K40的核心频率只是从732MHz略微提高到了745MHz,但是支持GPU加速,加速频率可达875MHz,此时比默认频率下的K40性能提升25%,再算上规格及基础频率的改变,Tesla K40相比目前的K20X有28%的性能提升。
另外,K40的显存频率也从之前的5.2GHz提高到了6GHz,显存位宽依然是384bit。带宽从之前的250GB/s提高到了288GB/s,不过TDP继续维持K20X的235W水准,整体控制的很不错。
大的变化要属显存容量了,之前K20X标配的是6GB,此次K40搭配的是12GB显存,不过显存颗粒的数量并没有增加,因为NVIDIA这次使用的是4Gb显存,此前包括桌面及Tesla、Quadro产品线上使用的显存颗粒都是2Gb容量,因此在维持24片显存的情况下Tesla K40的总容量提升到了12GB(24x4Gb),而K20X只有6GB(24x2Gb)。
还有一个值得注意的变化,那就是Tesla K40终于实现PCI-E 3.0支持了,虽然之前的Tesla K20X设计上也是支持PCI-E 3.0的,但是实际启用的还是PCI-E 2.0速度,此前NVIDIA在IVB-E发布时就有过类似的兼容性问题,现在已经不存在这样的问题了,支持PCI-E 3.0将使得K40与CPU之间的带宽从8GB/s提高到15.75GB/s。
Tesla K40这次发布之后即可开始出货,具体售价未知,不过估计在5500美元左右,此前的Tesla K20X价格约为3799美元。AMD虽然比NVIDIA抢先发布了12GB显存的专业卡FirePro S10000,不过出货要等到明年春季,目前依然是NVIDIA领先。
使用Intel处理器和Xeon Phi加速卡的天河2号刚刚蝉联了TOP500冠军,使用Tesla K20X加速卡的“泰坦”计算机继续排名第二,现在Tesla K40也发布了,不知道什么时候基于Tesla K40加速卡的计算机能登顶TOP500呢?
Nvidia Tesla C2050 CUDA核心频率:1.15 GHz CUDA核心数量:448
双精度浮点性能(峰值):515 Gflops
单精度浮点性能(峰值):1.03 Tflops
专用存储器总容量:3GB GDDR5
功耗:238W热设计功耗 主动散热
显示器大分辨率@ 60Hz:2560x1600
Nvidia Tesla C2050 CUDA核心频率:1.15 GHz CUDA核心数量:448
双精度浮点性能(峰值):515 Gflops
单精度浮点性能(峰值):1.03 Tflops
专用存储器总容量:3GB GDDR5
功耗:238W热设计功耗 主动散热
显示器大分辨率@ 60Hz:2560x1600
Nvidia Tesla C2070 CUDA核心频率:1.15 GHz CUDA核心数量:448
双精度浮点性能(峰值):515 Gflops
单精度浮点性能(峰值):1.03 Tflops
专用存储器总容量:6GB GDDR5
功耗:238W热设计功耗 主动散热
显示器大分辨率@ 60Hz:2560x1600
Nvidia Tesla C2070 CUDA核心频率:1.15 GHz CUDA核心数量:448
双精度浮点性能(峰值):515 Gflops
单精度浮点性能(峰值):1.03 Tflops
专用存储器总容量:6GB GDDR5
功耗:238W热设计功耗 主动散热
显示器大分辨率@ 60Hz:2560x1600
Nvidia Tesla C2075 CUDA核心频率:1.15 GHz CUDA核心数量:448
双精度浮点性能(峰值):515 Gflops
单精度浮点性能(峰值):1.03 Tflops
专用存储器总容量:6GB GDDR5
功耗:210W热设计功耗
显示器大分辨率:1600x1200
Nvidia Tesla M2090 CUDA核心频率:1.15 GHz CUDA核心数量:448
双精度浮点性能(峰值):515 Gflops
单精度浮点性能(峰值):1.33 Tflops
专用存储器总容量:6GB GDDR5
功耗:250W热设计功耗 被动散热
Nvidia Tesla K10 GPU 的数量和类型:2 Kepler GK104s CUDA核心数量:3072(每颗 GPU 1536 个)
双精度浮点性能:190 Gigaflops(每颗 GPU 95 Gflops)
单精度浮点性能:4577 Gigaflops(每颗 GPU 2288 Gflops)
专用存储器总容量:8 GB(每颗 GPU 4GB)
功耗:225W热设计功耗 被动散热
Nvidia Tesla K10 GPU 的数量和类型:2 Kepler GK104s CUDA核心数量:3072(每颗 GPU 1536 个)
双精度浮点性能:190 Gigaflops(每颗 GPU 95 Gflops)
单精度浮点性能:4577 Gigaflops(每颗 GPU 2288 Gflops)
专用存储器总容量:8 GB(每颗 GPU 4GB)
功耗:225W热设计功耗 被动散热
Nvidia Tesla K20C GPU 的数量和类型:1 Kepler GK110 CUDA核心数量:2496
双精度浮点性能:1.17 Tflops
单精度浮点性能:3.52 Tflops
专用存储器总容量:5GB
功耗:225W热设计功耗 主动散热
Nvidia Tesla K20C GPU 的数量和类型:1 Kepler GK110 CUDA核心数量:2496
双精度浮点性能:1.17 Tflops
单精度浮点性能:3.52 Tflops
专用存储器总容量:5GB
功耗:225W热设计功耗 主动散热
Nvidia Tesla K20M GPU 的数量和类型:1 Kepler GK110 CUDA核心数量:2496
双精度浮点性能:1.17 Tflops
单精度浮点性能:3.52 Tflops
专用存储器总容量:5GB
功耗:225W热设计功耗
Nvidia Tesla K20X GPU 的数量和类型:1 Kepler GK110 CUDA核心数量:2688
双精度浮点性能:1.31 Tflops
单精度浮点性能:3.95 Tflops
专用存储器总容量:6GB
功耗:235W热设计功耗 被动散热
Nvidia Tesla K40C GPU 的数量和类型:1 Kepler GK110 CUDA核心数量:2880
双精度浮点性能:1.43 Tflops
单精度浮点性能:4.29 Tflops
专用存储器总容量:12GB 显存带宽: 288GB/s 支持PCI-E 3.0
功耗:235W热设计功耗 主动散热
Nvidia Tesla K40C GPU 的数量和类型:1 Kepler GK110 CUDA核心数量:2880
双精度浮点性能:1.43 Tflops
单精度浮点性能:4.29 Tflops
专用存储器总容量:12GB 显存带宽: 288GB/s 支持PCI-E 3.0
功耗:235W热设计功耗 主动散热
Nvidia Tesla K40M GPU 的数量和类型:1 Kepler GK110 CUDA核心数量:2880
双精度浮点性能:1.43 Tflops
单精度浮点性能:4.29 Tflops
专用存储器总容量:12GB 显存带宽: 288GB/s 支持PCI-E 3.0
功耗:235W热设计功耗 被动散热
Nvidia GRID K1 GPU 的数量和类型:4*Kepler CUDA核心数量:768 专用存储器总容量:16GB DDR3 用于虚拟化
功耗:139W热设计功耗 被动散热
Nvidia GRID K2 GPU 的数量和类型:2*Kepler CUDA核心数量:3072 专用存储器总容量:8GB DDR5 用于虚拟化
功耗:225W热设计功耗 被动散热
XEON Phi 3120A 频率:1.1G 核心数量:57 专用存储器总容量:6GB 缓存:28.5MB
功耗:300W热设计功耗 主动散热
XEON Phi 5110P 频率:1.05G 核心数量:60 专用存储器总容量:8GB 缓存:30MB
功耗:225W热设计功耗 被动散热
XEON Phi 7120P 频率:1.238G 核心数量:61 专用存储器总容量:8GB 缓存:30.5MB
功耗:300W热设计功耗 被动散热
有 产 品 技 术 问 题, 请 让 我 知 道