关闭广告

英特尔第五代至强可扩展处理器发布,在CPU上跑AI更香了

量子位3402人阅读

金磊 丰色 发自 凹非寺
量子位 | 公众号 QbitAI

千呼万唤始出来,第五代英特尔®至强®可扩展处理器,它来了!

若是用一句话来概括它的特点,那就是——AI味道越发得浓厚

以训练、推理大模型为例:

  • 与第四代相比,训练性能提升多达29%,推理性能提升高达42%
  • 与第三代相比,AI训练和推理性能提升高达14倍。



什么概念?

现在若是将不超过200亿参数的模型“投喂”给第五代至强®可扩展处理器,那么时延将低到不超过100毫秒

也就是说,现在在CPU上跑大模型,着实是更香了。

而这也仅是英特尔在此次发布中的一隅,还包括打破自家“祖制”、被称为四十年来最重大架构转变的酷睿™Ultra。

此举亦是将AI的power注入到消费级PC中,用于加速本地的AI推理。

除此之外,具体到英特尔长期在各行各业扎根的AI实战应用,包括数据库、科学计算、生成式AI、机器学习、云服务等等。

它们也随着第五代至强®可扩展处理器的到来,在其内置的如英特尔®AMX、英特尔®SGX/TDX等其他内置加速器的帮助下,得到了更大的降本增效。

总而言之,纵观英特尔此次整场的发布,AI可谓贯穿始终。

最新英特尔处理器,AI更Power了

我们先来继续深入了解一下第五代至强®可扩展处理器披露的更多细节。

例如在性能优化方面,英特尔将各种参数做了以下提升:

  • CPU核心数量增加到64个,单核性能更高,每个内核都具备AI加速功能
  • 采用全新I/O技术(CXL、PCIe5),UPI速度提升
  • 内存带宽从4800 MT/s提高至5600 MT/s

我们再来纵向,与英特尔前两代产品做个比较,那么性能提升的结果是这样的:

  • 与上一代产品相比,相同热设计功耗下平均性能提升21%;与第三代产品比,平均性能提升87%
  • 与上一代产品相比,内存带宽提升高达16%,三级缓存容量提升至近3倍之多



不难看出,第五代至强® 可扩展处理器与“前任们”相比,在规格与性能上着实是有了不小的提升。

但英特尔可不仅仅是披露,而是已经将第五代至强®可扩展处理器用起来,并把实打实的使用效果展示了出来。



例如在大模型的推理方面,京东云便在现场展示了搭载第五代至强®可扩展处理器的新一代自研服务器所呈现的能力——

全部以超过20%的性能提升“姿势”亮相!



具体而言,京东云与上一代自研服务器有了如下的性能提升:

  • 整机性能提升达123%;
  • AI计算机视觉推理性能提升至138%;
  • Llama 2推理性能提升至151%。

这也再一次证明了在五代至强®上搞大模型,是越发得吃香了。

而除了大模型之外,像涉及AI的各种细分领域,如整机算力、内存宽带、视频处理等等,也有同样的实测结果。

这份结果则是来自采用了第五代英特尔®至强®可扩展处理器的火山引擎——

其全新升级的第三代弹性计算实例,整机算力提升39%;应用性能最高提升43%。



而且在性能提升的基础上,据火山引擎透露,通过其独有的潮汐资源并池能力,构建了百万核弹性资源池,能够用近似包月的成本提供按量使用体验,上云成本更低了!

这是由于使用内置于第五代至强®可扩展处理器中的加速器时,可将每瓦性能平均提升10倍;在能耗低至105W的同时,也有已针对工作负载优化的高能效SKU。

可以说是实打实的降本增效了。

在云计算和安全性方面,亮出实测体验的同样是来自国内的大厂——阿里云

在搭载第五代英特尔®至强®可扩展处理器及其内置的英特尔®AMX、英特尔®TDX加速引擎后,阿里云打造了“生成式AI模型及数据保护“的创新实践,使第8代ECS实例在安全性和AI性能上都获得了显著提升,且保持实例价格不变,普惠客户。

包括推理性能提高25%、QAT加解密性能提升20%、数据库性能提升25%,以及音视频性能提升15%。



值得一提的是,内置的英特尔®SGX/TDX还可以为企业分别提供更强也更易用的应用隔离能力和虚拟机(VM)层面的隔离和保密性,为现有应用提供了一条更简便的向可信执行环境迁移的路径。

以及第五代英特尔®至强®可扩展处理器在软件和引脚上是与上一代兼容的,还可以大大减少测试和验证工作。

总的来说,第五代至强®可扩展处理器可谓“诚意满满”、表现非常亮眼,而它背后所透露出来的,正是英特尔在AI领域一直都非常重视落地的态度。

背后是一部AI落地史

事实上,作为服务器/工作端芯片,英特尔®至强®可扩展处理器从2017年第一代产品开始就利用英特尔®AVX-512技术的矢量运算能力对AI进行加速上的尝试。

而2018年在第二代至强®可扩展处理器中导入深度学习加速技术(DL Boost)更是让至强成为“CPU跑AI”的代名词。

在之后第三代到第五代至强®可扩展处理器的演进中,从BF16的增添再到英特尔®AMX的入驻,可以说英特尔一直在充分利用CPU资源的道路上深耕,以求每一代处理器CPU都能支持各行各业推进AI实战

起先是在传统行业。

例如第二代至强®就发力智能制造,帮助企业解决海量实时数据处理挑战,提升生产线系统效率,完成“肉眼可见”的产能扩展。

随后,至强®可扩展处理器开始在大模型界大展身手。

AlphaFold2掀起的蛋白质折叠预测热潮之中,第三代和第四代至强®可扩展处理器连续接力,不断优化端到端通量能力。实现比GPU更具性价比的加速方案,直接拉低AI for Science的入场门槛。



这其中就有从第四代开始内置于CPU中,面向深度学习应用推出的创新AI加速引擎——英特尔®AMX的功劳。

作为矩阵相关的加速器,它能显著加速基于CPU平台的深度学习推理和训练,提升AI整体性能,对INT8、BF16等低精度数据类型都有着良好的支持。

与此同时,在大模型时代的OCR技术应用,也被第四代至强®可扩展处理器赋予了新的“灵魂”,准确率飙升、响应延迟更低。



同样,就在不久之前,借助第四代至强®可扩展处理器在NLP上的优化,专攻医疗行业的大语言模型也成功以较低成本在医疗机构部署落地。

在AI技术越来越深入各行各业的大趋势之下,至强®可扩展处理器让我们看到,它所代表的CPU解法完全能够有所作为、能够让不少AI应用在部署更为广泛、获取更加容易、应用门槛也更低的CPU平台上获得实实在在的落地开花。

第五代至强®可扩展处理器的发布,则让这个进程更进一步。

当然——

这一成绩的背后,确实是因为大家对“在CPU上跑AI”这件事上有需求,以及它本身也有极其深厚的价值和优势。

先说需求,无论是传统企业推进智能化改造,还是AI for Science、生成式AI等新兴技术的蓬勃发展,都需要强大的算力来驱动。

但大家面临的局势却是:专门的加速芯片供不应求,采购难不说,成本也十分高昂,因此还远远不够普及。

于是一部分人自然将目光投向CPU:

这个现实中最为“触手可及”的硬件,如果直接加以利用,岂不是事半功倍?

这就引出CPU的价值和优势。

就拿当下热门话题生成式AI来说,如果想在生产环境中普及这一能力,就得尽可能地控制成本。

相比训练来说,AI的推理对算力资源需求没有那么夸张,交给CPU完全能够胜任——不仅延迟更低,能效也更高。

像一些行业和业务,推理任务没有那么繁重,选择CPU无疑更具性价比。

此外,利用CPU直接进行部署还能让企业充分利用既有IT基础设施,避免异构平台的部署难题。

以上,我们也就能够理解:在传统架构中引入AI加速,就是CPU在这个时代的新宿命

而英特尔做的,就是竭尽全力帮大家挖掘、释放其中的价值。

驾驭整个AI管线,且不止CPU

最后,我们再回到今天的主角:第五代英特尔®至强®可扩展处理器。



实话说,如果和专门的GPU或AI加速芯片相比,它可能确实还不够炫,但主打亲民、易用(开箱即用,配套的软件和生态越发完善)。

更值得我们注意的是,就算在有专用加速器的场合,CPU无论是从数据预处理,还是模型开发和优化,再到部署和使用,也可以成为AI pipeline的一部分。

其中尤其在数据预处理阶段,它已可以称得上是主角的存在。



无论是以GB还是TB计,甚至更大的数据集,基于至强®可扩展处理器所打造的服务器,都能通过支持更大内存、减少I/O操作等优势,提供高效的处理和分析,节省AI开发中这一最琐碎耗时任务的时间。

基于以上,我们也不得不感叹,如今英特尔在谈AI时,话题更多样化了。

再加上它在GPU和专门的AI加速芯片上也有布局,“武器库”里的选择也更多了,火力覆盖的能力也更全面了。

毫无疑问,这一切,都指向英特尔全面加速AI的决心。

即用一系列具有性价比的产品组合来快速满足不同行业的AI落地需求。

AI 落地时代开始了,英特尔的机会也来了?

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中年男子自拍图火出圈 凭借"三副面孔"成新晋网红

国是直通车 浏览 22938

沪广VS深渝,冰火两重天

博闻财经 浏览 1288

70后省部级高官任上落马 前领导二十多天前被查

中国新闻周刊 浏览 26586

银行存款利率下调 年轻人跨城存钱:50万能多赚6000元

上观新闻 浏览 65421

海川慧富展望2024:A股估值处于历史中低水平 具有较大修复空间

私募荟 浏览 3349

明星基金经理离任后 曾经的代表作表现如何?

经济观察网 浏览 6080

特斯拉、丰田、小米都在用,迪王电池“桃李满天下”

Nice好车 浏览 3493

本赛季14球8助,孙兴慜英超生涯第五次单赛季参与至少20球

直播吧 浏览 2667

波音787客机存在新缺陷,或推迟交付

界面新闻 浏览 7118

ITC提交诉讼,Apple Watch在美国恐再次禁售

IT之家 浏览 3336

以军空袭加沙南部城市拉法 已致9人死亡

财联社 浏览 3306

矛盾升级!张艺兴妈妈微博沦陷,工作室约谈粉丝

萌神木木 浏览 6899

中国游客机场遭刁难索贿 马来西亚旅游部长"闯关救人"

金羊网 浏览 42548

欧文:努涅斯的挑射太疯狂,他需要转变思维才能成为顶级

懂球帝 浏览 3105

数据解读医药反腐风暴:已有179位医院院长、书记被查,哪些领域是重点?

上观新闻 浏览 5334

还记得《老友记》吗?除了钱德勒他们都过得如何?

橘子娱乐 浏览 4694

39岁冉莹颖和42岁李小璐同框大变样,撞脸赵本山

不八卦会死星人 浏览 3611

记者:快船送出部分现金 从活塞换来巴尔沙-科普里维察的签约权

直播吧 浏览 6115

王毅和乌外长一见面 对方就主动紧紧握住王毅的手

环球时报新闻 浏览 9901

朱珠是怎么在“浪姐”里美出圈的?

ELLE世界时装之苑杂志 浏览 9369

男篮土帅引骂声一片 国青约基奇准四双难遮羞 球迷怒斥教练关系硬

厝边人侃体育 浏览 6380
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1