提示:投资有风险,请谨慎操作!本站广告均来自于外部链接,并非本站内容!
Intel正式发布Gaudi 3 AI加速器:1200W功耗!性价比两倍于NVIDIA H100
发布时间: 2024-09-25 09:33
4

  早在4月份,Intel就宣布了新一代AI加速器Gaudi 3,现在它终于发布了,详细的规格参数也已出炉,竞争对手直指NVIDIA H100 GPU加速器,当然后者的Blackwell系列也要上量了。

  Gaudi 3的规格提升幅度堪称跨越式的,制造工艺从台积电7nm来到台积电5nm,MME(矩阵乘法引擎)从2个增加到8个,虽然每个MME内部的TPC(张量处理核心)从12个减少到8个,但是总数从24个大幅增加到了64个,另外媒体解码器差从8个增至14个。

  内置SRAM缓存容量翻番至96MB,带宽翻倍至12.8TB/s。

  核心性能方面,MME BF16/FP8都是1835 TFlops(每秒1.835亿亿次),矢量BF16则是28.8 TFlops(每秒28.8万亿次),分别提升了3.2倍、1.1倍、1.6倍。

  HBM2E高带宽内存容量从96GB增加到128GB(八颗),带宽也顺应增加来到惊人的3.7TB/s。

  24个200Gb RDMA网络接口,双向网络互连带宽1.2TB/s,主机接口峰值双向带宽128GB/s,系统总线升级为PCIe 5.0 x16。

  按照官方说法,Gaudi 3对比NVIDIA H100,LLM大模型推理性能领先50%、训练时间快40%,性价比则是对手的2倍。

  开发方面,无缝兼容PyTorch框架、Hugging Face Transformer和扩散模型。

  Gaudi 3加速器提供三种部署形态,一是OAM 2.0标准夹层卡,被动散热峰值功耗900W,液冷散热峰值功耗1200W,支持48个112Gb PAM4SerDes网络链接。

  二是HLB-325通用基板,支持八颗Gaudi 3,具体功耗未披露。

  三是HL-338扩展卡,PCIe 5.0 x16接口,被动散热峰值功耗600W,还可以四卡互连。

  Intel此前已宣布,IBM将会在其云服务中部署Gaudi 3加速器。

  另有消息称,Gaudi 3加速器也有中国特供版,其中OAM模组、PCIe模组的峰值功耗都限制至450W,算力自然也会大打折扣,但暂无更进一步说法。

(文章来源:快科技)

更多精彩大盘资讯敬请期待!

明日大盘网——股市最新消息,金融资讯栏目,提供最权威的明日大盘行情查询分析,最新股市在线行情,今日大盘在线行情,个股分析,股票经验等全方位的资讯服务。
总篇数
182263
点击量
1008150182