现在的位置: 首页资讯>正文

Imagination发布神经网络加速器和第九代GPU新品PowerVR 9XEP、 9XMP和9XTP

2018年12月06日 作者: 暂无评论 286+ 0

去年,Imagination失去最大客户苹果引发业界巨大的关注,最终Imagination被Canyon Bridge收购成为了一家中资公司。Imagination被收购之后财务非常稳健,并且越来越重视中国市场。Imagination在深圳发布了最新的的神经网络加速器(NNA)架构PowerVR Series3NX和第九代GPU系列新品PowerVR 9XEP、 9XMP和9XTP。

神经网络加速器提升PPA同时注重灵活性

最新推出的PowerVR 3NX系列基于前代产品,Imagination Technologies视觉和人工智能产品管理高级总监Neal Forse表示:“PowerVR 3NX系列基于我们屡获殊荣的2NX系列产品,相比2NX系列,3NX系列实现了芯片面积40%、性能效率近60%的提升,同时降低了35%的带宽需求,可以满足汽车、移动设备、物联网等嵌入式设备市场的需求。”

Imagination Technologies视觉和人工智能产品管理高级总监Neal Forse

Neal强调, 3NX系列在2NX系列之所以有明显的提升,是因为Imagination进行了多方面的改进和创新。但对于具体做了哪些改进和创新的问题,Neal表示更多细节不方便透露。

因此,我们只能从3NX系列提升了解Imagination的新品。相比2NX系列AX2145 1Tops和AX2185 4.1Tops的运算性能,3NX系列的两个同级别新核AX3145和AX3385的性能分别是1.2TOPS、 5TOPS,还有三个新核AX3125、AX3365、AX3595,对应的性能为0.6TOPS、2.4TOP、10TOPS。Imagination此次还推出了多核产品,性能从20TOPS到160TOPS不等。

还有值得一提的是,除了性能覆盖0.6TOPS到160TOPS满足应用的多样性需求,PowerVR 3NX-F(Flexible)可以提供更多的灵活性。之所以要推出这个架构,Neal表示有两方面的原因,一方面是可以让芯片设计公司在单核上做差异化,利用IP核构建神经网络加速器,而不需要把第三方GPU整合在一起,差异化对激烈的市场竞争而言非常关键;另一方面是神经网络行业正在快速发展,新技术、新框架需要可编程性和扩展性更强的SoC。

除此之外,3NX在安全性方面也有提升。同时,为迎合快速发展的市场,Imagination新的PowerVR工具也进行了多项扩展,为的是更好地映射新兴的网络模型、提供灵活性和性能优化的理想组合。

那么,满足AI需求硬件还是软件更加重要?Neal认为软件和硬件同等重要,硬件的异构可以实现更高效率,但缺少软件也没有意义。异构架构是Imagination拥抱AI的策略,软件方面Imagination的SDK里有Open API,塔建在Open CL之,C++语言就可以在异构的IP中运行,降低用户使用复杂性的同时最大化灵活性。

Imagination的第一代神经网络加速器产品2NX系列已经授权的用户主要集中在移动设备和汽车市场,并且有两家中国的手机厂商也使用了2NX神经网络加速器。3NX除了移动和汽车两大市场之外,智能相机监控、消费电子(尤其是数字电视)、低功耗IoT智能设备都是关键市场。

另外,Imagination Technologies副总裁兼中国区总经理刘国军表示:“国内包括监控、手机、物联网领域的公司都在评估我们的神经网络加速器。我们也在发展中国的生态系统,与手机厂商、OEM厂商直接一起工作,了解他们要做的AI应用,我们设计出更合适的AI的处理器去满足,我们从早期就介入。”

Imagination Technologies副总裁兼中国区总经理刘国军

这就意味着,AI的发展需要软件和硬件更好地结合,Imagination与手机和OEM厂商的紧密协作AI应用已经开始影响AI芯片的架构设计,性能、功耗、芯片面积、灵活性都是AI芯片的关键特性。

第九代PowerVR GPU带宽和内存占用率至少节省50%

AI芯片市场的竞争格局未定,在移动GPU领域Imagination具备领先优势,PowerVR GPU的持续迭代是其保持竞争优势和拓展市场的关键。Imagination Technologies PowerVR图形处理商务运营副总裁Graham Deacon指出,如今手机游戏市场的改变以及特殊的应用需求让GPU朝着成本更低,性能更高、更多灵活性以及更小芯片面积的方向发展。为了应对市场的趋势,Imagination的第九代PowerVR GPU新品包含 9XEP、 9XMP和9XTP,满足从低端到高端市场的需求。

Imagination Technologies PowerVR图形处理商务运营副总裁Graham Deacon

据介绍,XEP主要关注GUI,也就是图像界面,包括休闲游戏、填充力密度,最小面积上提供最高的填充率。9XEP可以实现每个时钟周期1-8个像素,14-64个FP32 OPS的性能,主要面向数字电视和低端手机市场。9XMP可以在最低的面积有最佳的计算能力,性能为每个时钟周期4-8个像素,128-256 FP32 Ops,主要是瞄准中端手机市场和低端汽车市场。9XTP是旗舰型产品,在密度、功率、效率方面都有提升,并且架构也是可伸缩的,性能可以达到每时钟周期8个像素,192FP32 Ops,甚至超更高。

另据了解,9XEP和9XMP都基于Rogue架构,这个架构已经非常成熟,不过9XEP架构进行了微调,9XMP将每个集群的ALU扩展了2倍,位宽从16位扩展到32位,目的都是提高性能。9XTP则是基于Furian架构,该架构由Rogue演变而来。Graham Deacon表示,虽然Furian架构还不够成熟,但这也意味着我们还有很多机会进行改进,也能让这个架构更具灵活性。

虽然架构有所不同,但相同的是新GPU都采用PVRIC4技术,PVRIC4是Imagination图像压缩技术的最新一代,可实现随机访问视觉无损图像压缩,确保带宽和内存占用率至少节省50%,并使系统能够去克服性能带宽限制。与Imagination的上一代GPU相比,新的GPU系列还提供性能/功耗/面积和时序优化,以及包括可降低合成的工作负载带宽和成本的全新alpha缓冲/单元模块提示等在内的新功能。

从Graham Deacon展示的图中可以看到,借助9XMP可以提升图像的质量,让游戏中的图像细节更加真实,不过对比三款新GPU的显示效果,其显示的图像细节和效果也有着容易分辨的差别。

还需指出的是,PowerVR GPU利用了一项被称为分块延迟的渲染(TBDR)技术,TBDR保证了几乎所有的图形处理都在“芯片上”完成,并将存储带宽的需求降至最低。基于多方面的优势,过去的25年PowerVR GPU已经支持了最受欢迎的游戏和街机系统,并推动了移动设备的图像革命。如今PowerVR GPU已经在汽车虚拟仪表、娱乐系统中占有非常高的市场份额,手机、数字电视也将继续是PowerVR GPU的重要市场。

还有,新的GPU可以与PowerVR Series3NX神经网络加速器配对使用。刘国军也表示:“中国许多做汽车电子的公司以前在后装市场,现在他们想要进入前装市场,产品就需要满足车规的要求。因此,我们会与芯片设计公司和Tier1合作,把我们的GPU和神经网络加速器都放到车规的生态里,共同满足汽车市场的需求。”

Imagination可能会宣布推出面向AI训练的GPU。对于目前比较火热RISC-V架构的支持,Imagination的态度是作为GPU IP的提供商会支持不同的CPU架构,目前他们的客户有两家都在使用RISC-V。

小结

作为IP提供商,Imagination关注的是提供基础框架,并能够实现最优化的功耗和性能满足芯片设计公司和应用的需求。作为以技术见长的公司,Imagination并没有因为失去大客户而一直摇摆不定,在被中资收购后以及资本的支持下保持着产品的更新。如今PowerVR GPU已经在汽车市场取得了不错的成绩,手机市场也能让其客户与高通竞争。

至于神经网络加速器,正如刘国军所说,每家厂商的起点不一样,大家也是传承自己的技术推出神经网络加速器。虽然手机厂商也都纷纷自主研发NPU,有可能是在用第一代产品去市场试水发现优缺点,未来为更好满足AI应用的需求,具备更好性能和功耗指标的AI芯片必不可少,也可能使用第三方的IP。

热门推荐:

Intel RealSense深度摄像头D400系列“更便捷的秘密”的等你来发现

Analog Devices EVAL-ADXL362评估板给开发设计者更多选择

Cypress Semiconductor PSoC6 BLE开发套件,美好的设计即将发生

STMicroelectronics VL53L1X飞行时间测距传感器,绝对测距无惧颜色和反射

NXP i.MX 8MQuad评估套件MCIMX8M-EVK ,一款开箱即用的高性能开发工具

英飞凌IM69D120和IM69D130 XENSIV MEMS麦克风,为低失真和高信噪比而设计

原文地址:https://www.eeboard.com/news/imagination-gpu/

搜索爱板网加关注,每日最新的开发板、智能硬件、开源硬件、活动等信息可以让你一手全掌握。推荐关注!

【微信扫描下图可直接关注】

 

 

发表评论

相关文章

都在自主研发GPU,继苹果后,三星跟进,原因何在?

前段时间,一直有消息称韩国电子巨头三星即将自主设计GPU图形处理单元,为此不仅有招聘信息侧面证明,更有不少熟知内情的人士爆料了诸多项目的细节。如果这是事实,说明未来三星将有望推出一...

谷歌推出AutoML,使神经网络设计降低门槛

在推出AutoML时,谷歌首席执行官Sundar Pichai在博客中写道:“设计神经网络是非常耗时的,其对专业知识的极高要求使得只有小部分科研人员和工程师才能参与设计。这就是我们创建AutoML方法的...

能效将领先高通的三星自研GPU ——你期待吗?

 近日,据媒体报道,三星纯自主GPU取得进展,将首先用于入门级移动产品。而此前,三星手机上的GPU芯片基本都是需要向第三方厂商进行购买

PC逐渐式微?Intel与你一同来看

比如Intel在存储领域发力就是一个显著的信号,还有FPGA芯片的开发、限制Xeon E3的民用并最终砍掉等等。这也就不难理解,为什么PC平台的处理器这些年经历着“得过且过”的日子了。

小米Max 3安兔兔跑分近12万,搭载骁龙636

小米Max 3的总成绩达到了118741分,与高通骁龙660的跑分比较接近(骁龙660跑分在13万左右)。其中CPU部分得分为55879,GPU得分为21313,UX得分为32744, MEM得分为8805。