出品 21ic中国电子网 付斌
网站:21ic.com
多次自我突破的摩尔定律,几番“压榨”下,虽说有望回归两年一更新的频率,但还是有很多人感叹“廉颇老矣”。不过事实上,摩尔定律在提出之时,就在论文的第二页指明了摩尔定律失效的前路,这就是电子行业所追捧的“异构计算”,intel现称之为XPU(CPU+GPU+FPGA+加速器)。
摩尔定律至今已经自我突破了三次瓶颈。
intel已让其重新回归两年一更新。
但实际上,我们仍然不知道1nm节点后的名字,这一迷之领域仍是纸上谈兵的阶段。反观登纳德缩放比例定律和阿姆达尔定律也基本进入瓶颈期,
现在正是异构计算,即加速计算的时代。
XPU+oneAPI的超异构计算
的概念,即通过CPU、GPU、FPGA和其他加速器的混合式架构,配合统一开发平台oneAPI进行软硬的有机结合方式进行超级加速计算。同期,全新的计算架构Xe被一并提出,并在今年8月正式宣布Xe图形架构下的几款独立显卡。
11月11日,intel召开“XPU和软件发布会”,发布了独立服务器GPU,并宣布将于今年12月正式交付oneAPI Gold版本,21ic中国电子网记者受邀参加此次发布会。
硬件:支持Linux的独立服务器GPU
(H3C)
XG310是一款云服务GPU,在相比传统卡3/4的长度
(全高x16 PCle 3.0)
下,封装了4颗intel服务器GPU。
典型双卡系统之中,可支持120个Android游戏并发用户,而这一数字最高甚至可以扩展到160个并发用户,实际数量取决于具体游戏和服务器配置。
换言之,只需要两张GPU,无需再单独购置服务器,就多能满足120个玩家实时连线游戏的任务。
Xe-LP微架构的高密度、低延时独立GPU,
而本款产品的特殊之处在于除了瞄准了视频和游戏渲染应用场景下的数据中心,更加
优化了对Linux操作系统的支持,
使得不同操作系统之间代码复用成为了可能,也使得这款独立GPU注定能够成为Android游戏云服务的新宠。
128-bit渲染管线
(128-bit wide pipeline)
和
8GB LPDDR4 专用板载低功耗显存
。
明年迁移到oneAPI视频处理库
(oneVPL)
当中。
(CentOS/Ubuntu)
的容器和虚拟化上提供了更好的优化,扩展代码库在Linux上的支持。从架构上来看,游戏流服务将输入到intel Cloud Rendering
(ICR)
中;利用FFMPEG编译、3DMesa渲染输出声音;利用intel GPU UMD渲染视频;而Android 游戏的云端主机和Android容器将利用intel桥接技术连接。
Gamestream、腾讯和Ubitus。
高密度、低时延、低功耗、低TCO
(总拥有成本)
的解决方案,让我们能够在每台双卡服务器上生成超过100个游戏实例,诸如《王者荣耀》、《传说对决》。”
此款云服务独立GPU在功耗上优化的非常彻底,
不仅使用了独立显卡Xe架构中最为低功耗的Xe-LP,还利用LPDDR4作为显存进一步降低功耗。众所周知数据中心是耗电和发热大户,因此只有在提高密度和性能的架构下降低器件的功耗才能全面压低功耗。
无需扩充服务器,直接插独立GPU卡对于节约成本具有非凡的意义。
软件:oneAPI Gold正式登场
直到今天oneAPI Gold正式发布,并将于今年12月正式交付。
oneAPI包容着一切的硬件。
(Data ParallelC++)
,用一个等式简单解释就是
DPC++ =ISO C++ and Khronos SYCL。
正因为语法接近CUDA,所以在学习曲线上oneAPI是极简的,上手难度很低。
提供毫不妥协的性能,不受限于单一厂商专用的代码构建,就能实现原有代码的集成。
(intel DL Boost)
方面,不仅支持PyTorch、mxnet、sklearn、NumPy、XGBoost,
最近也获得了微软Azure和TensorFlow的支持;众多领先的研究机构、公司和大学也支持oneAPI。
最新发布的独立显卡的渲染上,
oneAPI都得心应手。
oneAPI Gold工具包将于12月在本地和intelDevCloud上免费提供,
同时还将提供包含intel技术咨询工程师全球支持的商业版本。intel还会将intel Parallel Studio XE和intel System Studio工具套件迁移到oneAPI产品中。
(ISPC)
将在oneAPI级别零之上运行。oneAPI级别零是为XPU提供硬件抽象层的API的集合,由intel创建,提供了底层的直接到硬件的接口,以供客户跨多种硬件平台进行编程。ISPC是oneAPI渲染工具包的已安装基础语言,该工具包支持大多数主流的视频工作室基于至强处理器的渲染场,并将支持基于Xe架构的GPU。
oneAPI Gold相比测试版已可以胜任XPU的艰巨任务,
从工具的迁移和GPU使用的渲染工具箱的加入,使得独立GPU加入至强可扩展处理器架构中无需使用其他软件。另一方面,oneAPI也是与硬件是相辅相成的,软硬件的闭环系统成为intel坚不可摧的生态。
左手一个硬件,右手一个软件
intel的XPU宏图
(封装&制程,架构、内存&存储、互连、安全、软件)
,那么“城池”便是XPU+oneAPI的超异构计算。
我们既是历史的见证者也是创造者。笔者曾多次强调,
一整套的产品都放在同一软硬件架构下,无论从性能上来讲,还是从稳定性、适配性、更替性上来说,均具天生优势。
(XEON)
可扩展处理器,命名上也采用了更加符合主流、直观易懂的“铜牌”、“银牌”、“金牌”、“铂金”的分级。
Xe-LP(低功耗):
定位为PC和移动平台最高效架构,主要使用LPDDR再次进行功耗的压缩。目前已在8月发布Xe DG1,近期发布了第11代intel酷睿移动处理器集成的锐炬®Xe显卡和intel锐炬®Xe MAX独立显卡。
相关热度新闻
英特尔没输!重磅发的这些技术“渡劫”!
Intel发布三代至强、二代傲腾!
“危”中有“机”,Intel放大招
【2】必看!100个示波器基础知识问答
【3】
【2】半导体行业的人都在关注这几个公众号
【3】
免责声明:本文内容由21ic获得授权后发布,版权归原作者所有,本平台仅提供信息存储服务。文章仅代表作者个人观点,不代表本平台立场,如有问题,请联系我们,谢谢!