作者:电子创新网张国斌
在中国众多被卡脖子的IC产品中,GPU是被卡的最严重的一款产品,美国政府对中国GPU发展严防死守,一方面不停,ux把中国做GPU的初创企业拉入实体名单,另外就是简单粗暴地通过禁售来卡中国,例如最近1017新规就把摩尔线程和壁仞科技拉入黑名单同时禁售三款来自英伟达、AMD和英特尔的GPU产品。
在位于英国伦敦附近Kings Langley村的中资公司Imagination Technologies 的助力下,中国GPU之路艰难前行,近几年,几家本土公司通过授权Imagination的GPU IP已经开始产品化,今天,Imagination再推出一款性能强大的GPU IP--IMG DXD,它是专为台式机、笔记本电脑和云游戏图形体验量身打造的一款可扩展GPU IP,不但有强大的 图像渲染能力,在算力方面也比上一代BXT系列有很多提升!IMG DXD 可以运行主流的DX11 PC 游戏以及其他基于Windows 的应用程序和手机游戏,据悉这款新品已获得桌面市场的授权许可。
Imagination公司市场副总裁 Victoria Rege在发布会上强调:Imagination拥有独特的行业知识和数十年的半导体领域经验,Imagination通过投资研发、产品和客户增长实现成功转型,Imagination半导体专业技术的创新和客户服务的支持。
Imagination公司市场副总裁 Victoria Rege
她表示,Imagination不但有强大的GPU ,也有基于RISC-V架构的CPU。“而且我们在RISC-V社区里是非常活跃的,我们来中国也是会参与这边的‘RISC-V峰会’。就在今天,我们在美国也参与美国硅谷的一个RISC-V峰会?”她强调,“目前采用Imagination IP芯片累计出货量,已累计达110亿,Imagination拥有3300个以上的专利和专利申请。Imagination专注在移动、消费、汽车和桌面服务器等。我们的桌面服务器是超过有3亿的出货量。我们是致力于提供一个嵌入式GPU、CPU、AI式连接一站式解决方案的公司。”
她表示目前客户面临的挑战主要是四个:一是芯片设计复杂度在不断增长。二是开发成本也在一直上升。三是对IP的需求显著增加,Imagination的解决之道体现在四个方面:
1.对高级图形处理的需求:从消费类设备到云游戏,无处不在。
2.海量数据和人工智能的激增:先进的传感器、更强的连接性和人工智能能力的飞跃发展。
3.ADAS和自动驾驶汽车:用更清洁、更智能的汽车推动未来发展。
4.边缘计算:利用所有可用处理器的优势进行高效应用加速。
Imagination公司前瞻技术副总裁 Kristof Beets
Imagination公司前瞻技术副总裁 Kristof Beets表示今天发布的新品专注于PC和桌面端。他解释说其实讲到“桌面端”的应用涵盖了非常广的内容,包括:一些主流的PC的应用。同时,还针对的有包括以安卓、还有其它的一些系统所支持的移动端游戏。还有就是云游戏,包括:云游戏的体验和云游戏的开发。
他指出近几年云游戏系统发展迅猛,用“云游戏”的用户也在不断上升。预计到2027年中国游戏玩家数量会到7.3亿!亚太地区每月云游戏活跃用户会从2022年的1700万快速增长到2025年的3200万!而全球服务器GPU单元从2022年的320万增长到2025年的890万!这是一个巨大的增量市场!
他表示针对“云游戏”市场,,Imagination主要关注在:
1.玩家体验-- 性能上的体验,包括:速度、延时、效率上等所有的这些东西。
2.玩家数量--每一核、每一个芯片、每一片板和每一个服务器上,所能允许的用户数。就是通过技术方式能够最终提高每一个芯片所能处理的用户数目。
3.运营成本--总体的运营成本,包括我们IP成本,同时还有包括开发硅片的成本等。
他以上图为例,指出Imagination开发GPU已有30年的经验。其实Imagination最早的开发都是针对桌面端和PC端的GPU的,其实“游戏”一直都是属于Imagination的DNA,例如Imagination帮助过世嘉的Dreamcast主机提供硬件。同时还参与了PSV的硬件、显卡。从2001年开始,Imagination开始涉足IP解决方案,Imagination希望通过“IP的方式”解决移动端的一些问题。Imagination最近的一次GPU的架构变更是在2019年交付了A系列。然后在2020年发布了“B系列”,今天我们所要发布的就是“高端桌面级”的下一代升级产品IMG DXD。
|IMG DXD主要特点:
IMG DXD 性能是目前在 PCIe factor板上推出的图形处理器 IMG BXT 单核性能的 2.25 倍;IMG DXD 双核配置可提供 5 TFLOPS FP32 和 144 GTexel/s,足以满足主流游戏玩家对流畅帧速率的需求。授权用户可以利用 Imagination 创新的多核技术,不断提高性能水平。另外的一个性能上的提升就是DXD是支持DirectX 11,“DirectX11是一个非常关键的API,它相当于是主宰了整个生态系统、就是大部分主流的游戏都会支持DirectX11的。除此之外,我们的硬件还支持OpenGL4.7,还支持Vulkan API。也就是说,我们基本上支持所有的主流的一些API。”他指出,“上图双核配置能够提供非常高的填充率,达到144GTexel/s。与此同时,它使用频率只是1GHz。对于FP32能够做到4.6TFLOPS,对于FT16够翻一倍达到9.2TFLOPS。而对于8位的AI性能可以再把性能翻一倍达到18TFLOPS。此外,它支持业界标准API,这对于我们的生态系统、还有包括内容和兼容性来说都是非常重要的。”
他进一步分析DXD GPU的架构,指出DXD增加了下面额外的两个USC,同时还增加了一些CPU来提升性能,FP32计算的数目是256,FP16是512。同时,它还有32KB的本地存储。对于纹理处理增加了对于DirectX的支持,增加了BCN格式。在固件方面,Imagination完全拥抱RISC-V,所以在GPU的管理上使用RISC-V固件处理器,来去进行。而在缓存方面,Imagination也更改了GPU架构,以便可以更好支持这种高性能的GPU。
他还强调了一个功能是“片断着色率”。“我们去评估着色器不再是以“像素点”去看,而是看“像素块”。比如:我们建立一个“着色器一”、那么可能它是渲染2×2或者是4×4的一个区域。也就是说,它降低了我们“着色器”的成本、降低了它的功耗同时还能够提高它的性能,而且能够降低它的带宽。也就是说在不损失视觉效果的前提下,能够带来非常多的功耗优化。”
上图显示了DXD与B系列相比带来的改进,“传统的GPU是用一个2D的图象映射到一个3D球上。这种方法需要很多的逻辑资源和计算资源,包括视角调整、透视计算等等,会带来非常大的成本。但是我们发现其实GPU经常会被用来做一些2D运算和操作。也就是说只通过输入的像素,然后再通过运算、然后直接输出像素就可以。比如说就有一些例子,如视觉图象的后处理,还有包括计算机式的摄像头拍照等等,它们都可以去通过这样的方法把这种吞吐量提高一倍。”他解释说,“这里有一个本地RISC-V固件处理器。它能可管理GPU的性能提高40%。另外一个技术就是流水线数据主控。在上一代BXT GPU上,我们设置了一个渲染、然后在每一个WorkLoad之间再去进行处理。这样导致每个Workload之间有空闲时间。而在DXD上我们可以在前一个Workload没有结束时,就设置下一个Workload直接开始。这样就避免了空闲时间,就不会浪费性能。此外,DXD支持 ASTC HDR,可在使用高质量纹理时最大限度地减少带宽。”
这张图把BXT-32-1024双核解决方案和DXD-72-2304MC1单核方案做了对比,可以看出DXD解决方案在ALU方面以及纹理方面有12%的提升,除了ALU之外,还有更多性能的提升,从上图看最大的差距出现在Workload1和Workload2上,它们就是代表着高端桌面游戏领域。
他指出对“云游戏”而言,“多用户、可扩展性”是非常关键的。DXD也支持多核,最多到4个核。根据客户的要求,TA可以在四个核上去进行不同的实例、独立运作,也可以去把这些不同的核组合起来来完成同一个Workload。“我们的HyperLane虚拟化技术是可以允许“一个核分成八个不同的硬件域、其中每一个域都可以完成独立的Workload,同时我们在多核的情况下这种虚拟化还是可以继续往上去进行相乘。例如:四核完全可以做到32个虚拟域、完全独立运行不同用户的游戏。因为这是我们在硬件层面上所做的分割,所以它所带来的开销和性能降低基本可以忽略不计。”
他表示Imagination这种DDK的发布对于新OS版本的支持、新API、新驱动的更新都是非常重要的,而Imagination也是把这些服务都提供给客户,也会提供生态系统的支持。
上图展示了Imagination的生态合作伙伴,所以Imagination也是和Khronos一起合作为Vulkan和OpenGL提供支持。同时Imagination也和微软一起合作,也提供了对于DirectX的支持。
上图展现了Imagination的产品演进过程,从最初的BXT到针对移动市场的CXT--再到DXD,图像和AI性能都在提升。
Imagination副总裁兼中国区总经理刘国军在媒体问答时指出:从2015年开始,Imagination不断提升对中国的重视程度,作为一家同时拥有CPU、GPU和NPU的公司,Imagination加持长期主义打造生态,“我们就非常重视在中国的生态建设,跟各方面的生态伙伴进行合作。这其中包括客户、应用商以及中间方案商、软件开发商等。”他指出,“今年我们举办了多场行业培训,在各个领域都有各种各样的网上的培训、此外还有跟大学的合作等,未来,我们有两个方面的布局,一是产品层面、生态伙伴的扩大 ,二是在应用领域扩大,从移动领域扩展到汽车、数据中心,我们要为中国本地的芯片设计者提供更多应用方面的竞争力。”
DXD亮点
IMG DXD 集三大技术亮点于一身,对希望优化每瓦服务量和服务质量的云游戏公司具有极大吸引力:
IMG DXD 的多核方法非常灵活。每个内核都可以作为单独的 GPU 实例独立运行,在云游戏场景中,这有助于最大限度地增加每个 GPU 可承载的游戏玩家数量。或者,利用所有单核组合在一起的运算能力,使单个用户(在云游戏或台式机场景中)获得最高质量。
Imagination 的 HyperLane 虚拟化技术在此基础上更进一步,使每个核可承载多达 8 个游戏玩家,并提供全面的安全性和灵活的性能管理。
它采用了 PowerVR 基于分块延迟渲染架构的固有能效,该架构最初设计用于向功耗受电池寿命和封装限制的市场提供高质量 3D 图形。
IMG DXD 适用于所有流行的 CPU 架构,包括 RISC-V。它支持 Linux、Android 和 Windows 以及 UOS 和 Kylin OS 等新兴操作系统。
11月10日起,Imagination 将在 ICCAD 展位 #B62上展示最新的基于 IMG GPU IP的云游戏演示,同时在11月11日上午 IP 与 IC 设计分论坛(一)的演讲中介绍有关 IMG DXD 的更多信息。
注:本文为原创文章,未经作者授权严禁转载或部分摘录切割使用,否则我们将保留侵权追诉的权利