今天,随着Instinct MI200系列加速器的推出,AMD在专业图形市场上引起了一些轰动。AMD声称,新的Instinct MI250和MI250X在双精度(FP64) HPC应用中的性能比竞争对手高4.9倍,并为AI工作负载提供380 TFLOPs的峰值理论半精度(FP16)性能。
insttmi200系列GPU基于AMD新的CDNA 2架构构建,并兼作AMD首款多芯片GPU,支持高达128GB的HBM2e内存。借助这些GPU,结合第三代EPYC处理器,AMD将与能源部橡树岭国家实验室合作,利用前沿超级计算机实现十亿次计算,预计将提供超过1.5亿次浮点运算的峰值计算。
在下表中,可以看到AMD Instinct MI250和MI250X的规格:
模型
测量单位
流线处理
FP64|FP32矢量(峰值)
FP64|FP32矩阵(峰值)
FP16|bf16(峰值)
INT4|INT8(峰值)
HBM2e ECC存储器
存储带宽
构成因素
AMD instinct MI250X
220
14,080
高达47.9 TF
高达95.7 TF
高达383 TF
最多383个
128GB
3.2 TB/秒
OCP加速器模块
AMD本能MI250
208
13,312
高达45.3 TF
高达90.5 TF
高达362.1 TF
最高362.1
128GB
3.2 TB/秒
OCP加速器模块
AMD Instinct MI200加速器的一些关键特性包括用于加速FP64和FP32矩阵运算的第二代矩阵核心的CDNA 2架构,以及业界首款采用AMD新的2.5D开销扇出桥技术的多芯片GPU设计,与之前的AMD GPU相比,可以提供1.8倍的核心和2.7倍的内存带宽。
正如您所料,AMD Infinity Fabric也将重返这里。多达八个Infinity光纤链路将MI200与优化的第三代EPYC处理器和节点中的其他GPU连接起来,以最大限度地提高整体性能和系统吞吐量。
标签:
免责声明:本文由用户上传,如有侵权请联系删除!