现在的位置: 首页资讯>正文
未来自动驾驶所用AI芯片,将是ASIC架构当道!
2018年01月17日 作者: 暂无评论 921+ 0

AI

从今年CES展会来看,自动驾驶俨然已成为本次展会的主角,各大汽车科技厂商都是有备而来,展示自动驾驶相关的科技成果,足以让世人对自动驾驶的未来充满了期待,特别是英伟达在展会上发布DRIVE 一系列软硬件AI芯片系统掀起了整个展会的小高潮!

目前,自动驾驶最为火热的芯片架构为GPU。而英伟达最新推出的DRIVE Xavter就是基于此架构。GPU架构:技术成熟,具有优秀的大规模并行运算能力,但功耗巨大是其最明显的劣势,其上一代产品DRIVE PX 2在功耗上达到了450W,是最新一代芯片 DRVIE Xavier15倍之多。

AI

自动驾驶市场空间广阔,集环境感知、决策推断、执行于一体,ADAS(高级驾驶辅助系统)芯片是其核心。以GPU(图形处理器)和CPU为两大阵营的芯片发展已较成熟。现阶段,以深度学习为基础的AI芯片正蓬勃发展,车企对自动驾驶芯片的选择也出现了新方向。

运用于自动驾驶的芯片架构主要有4种:CPU、GPU、FPGA(现场可编程门阵列)和ASIC(专用集成电路),那么这几中芯片架构都有什么区别呢?

GPU:是单指令、多数据处理,采用数量众多的计算单元和超长的流水线,如名字一样,图形处理器,GPU善于处理图像领域的运算加速。但GPU无法单独工作,必须由CPU进行控制调用才能工作。CPU可单独作用,处理复杂的逻辑运算和不同的数据类型,但当需要大量的处理类型统一的数据时,则可调用GPU进行并行计算。

FPGA:和GPU相反,FPGA适用于多指令,单数据流的分析,因此常用于预测阶段,如云端。FPGA是用硬件实现软件算法,因此在实现复杂算法方面有一定的难度,缺点是价格比较高。将FPGA和GPU对比发现,一是缺少内存和控制所带来的存储和读取部分,速度更快。二是因为缺少读取的作用,所以功耗低,劣势是运算量并不是很大。结合CPU和GPU各自的优势,有一种解决方案就是异构,如GPU+FPGA。

ASIC芯片:是专用定制芯片,为实现特定要求而定制的芯片。除了不能扩展以外,在功耗、可靠性、体积方面都有优势,尤其在高性能、低功耗的移动端。谷歌的TPU、寒武纪的GPU,地平线的BPU都属于ASIC芯片。谷歌的TPU比CPU和GPU的方案快30-80倍,与CPU和GPU相比,TPU把控制缩小了,因此减少了芯片的面积,降低了功耗。

其实总的来说,它们各具特点,CPU的数据处理能力弱;GPU的功耗大,散热高;FPGA比GPU的功耗低,但相对于ASIC,一次性成本较高;ASIC的体积小、功耗低、计算性能及效率高,但开发周期长,初期成本高。

作为芯片厂商的两大全球巨头,以GPU为主导的英伟达和以GPU+FPGA集成于CPU的英特尔并不是车企唯一的选择。2017年底,蔚来汽车在发布的第一款自动驾驶量产车型ES8上,选择了Mobileye EyeQ4芯片,其最高运算速率为2.5万亿次/秒,功耗为3W,该芯片属于ASIC芯片。奥迪A8、沃尔沃XC90、特斯拉Model S等自动驾驶车型上搭载了Mobileye EyeQ3芯片,最高运算速率为0.256万亿次/秒,功耗为2.5W,可满足自动驾驶L2~L3级所需的计算能力。值得注意的是,特斯拉在Model X以及Model3上选择了英伟达的定制计算平台Drive PX2,虽然最高运算速率达到8万亿次/秒,但功耗却高达250W,特斯拉表示会自己研发AI专用运算芯片,以降低功耗和提升效率。

AI

因此,尽管现阶段采用GPU架构、GPU+FPGA异构化、ASIC架构的车企并行存在,但综合来看,车企更倾向于选择ASIC专用型芯片,以自身更好的软件算法同时满足高性能和低功耗的要求。

专属AI芯片的研发只有少数科技巨头如谷歌、英特尔参与其中。近日,国内初创企业地平线机器人发布了针对智能驾驶的AI专用芯片“征程1.0”,其最高运算速率为1万亿次/秒,功耗仅为1.5W。它与Mobileye EyeQ3所采用的都是40纳米的制程,参数对比显示,“征程1.0”在功耗较小的情况下实现了更高的性能,研发时间也相对较短,这得益于地平线的专属BPU(分支处理单元)架构,同时,地平线是面向中国智能驾驶场景所研发的专用芯片,相比Mobileye,其芯片方案要更适合于中国场景,这是国内企业在AI芯片领域的突破,也是具有创新性的中国方案。此外,国内寒武纪、西井科技等也在AI专用芯片领域有所布局。

通用芯片GPU、CPU、FPGA在某些特定场景下会造成功能浪费,面积和功耗的冗余。ASIC专用芯片可以根据特定的算法实现计算能力和计算效率的专用定制化,随着各类应用场景在自动驾驶不同领域的渗透,即时性应用场景在深度学习上所需要的推理能力越来越强,在云端进行软件升级并进行计算已无法满足特定场景的即时性要求(5G时代的来临或许有可能解决这一数据传输速率的瓶颈),因此,各类应用场景将推动AI专用芯片的研发。

综上所述,各芯片架构并存的现象还将会延续一段时间,在自动驾驶车进入量产阶段后,GPU、CPU将会更广泛应用于一些较为通用的场景,大规模AI芯片的需求量将使ASIC前期的成本显著降低,车企选择ASIC架构的AI芯片或将成为趋势。因此,国内AI初创企业应紧跟自动驾驶对于AI芯片的需求,针对中国智能驾驶应用场景,采用软硬件一体的结合方案,使算法在硬件上得到最优化,从而在与整车厂的合作中,能够针对特定需求定制芯片,扩大自身优势,在AI芯片领域占据一席之地。

发表评论

相关文章

国内智能音箱TOP10排行之殇,敢问路在何方?

自从国际电商巨头亚马逊突发奇想捣鼓出第一款智能音箱 Echo大火之后,犹如打开一扇泄洪闸门,后继者如洪水猛兽般蜂拥而至,无论国外科技巨头诸如谷歌、苹果、微软等,还是大家所熟知小米、阿...

还在打马赛克?AI可还原了!

当然马赛克除了有时候会耽误宅男的心情,更多的时候是起到了非常重要的保护作用。比如对一些涉及恐怖、血腥内容,或者警务人员的画面时候,打个马赛克能避免对人造成不适,也可以保护公职人...

人工智能最终是否能具有自己的意识?

很多人都有这样的疑问:人工智能最终是否能具有自己的意识?而一名人工智能专家对此的回应是,这主要取决于我们自己是否希望让机器拥有意识。这听上去可能太大胆了些。意识的内在机制——我们...

苹果:可通过透明的挡风玻璃能够感知周围的真实环境

在专利中,苹果表示通过透明的挡风玻璃能够感知周围的真实环境,并借助AR技术向车内成员发送包含天气、路况、车速、路径导航等丰富信息。

矿机芯片厂商抢先首发7nm芯片,能效和效益都翻一番

全球第二大矿机芯片厂商嘉楠耘智昨天首发了7nm工艺的ASIC芯片,并应用在旗下的阿瓦隆A9矿机上,比特币挖矿性能从之前的14T提升到最高30T,性能翻倍