现在的位置: 首页资讯>正文

30年前的“CNN梦”在这颗芯片降生,能效比超Tesla10倍

2019年01月11日 作者: 暂无评论 518+ 0

上面提到的MPE可能够让芯片像人脑一样,将逻辑和内存集成在一起,这样在处理人工智能数据时就不会浪费精力和时间。 AI算法可以即时访问数据,快速提供结果,并且不会浪费将数据移入和移出位于系统其他位置的离散存储器的能量。这使得数据处理具有非常高的性能,同时使用非常少的能量。

关键细节探讨
GTI总部位于硅谷地区的核心城市Milpitas,成立于2017年初。GTI由经验丰富的硅谷企业家和人工智能科学家创建,通过将云人工智能的强大功能引入本地设备,推动人工智能的应用,并以更高的性能和效率提高云AI性能,提供最大的人工智能定制新设备和人工智能升级路径给客户。

“我们是唯一一个以矩阵乘法作为基本计算元素的人,”GTI总裁Frank Lin谈道,“其他芯片制造商,他们中的一些人正在考虑新的矩阵或张量架构,”,但是Gyrfalcon在2018年1月就已经向客户提供了第一块芯片。

GTI认为,通过将每个相同的计算单元与内存合并成“内存中的AI处理”与 APiM架构的方法相结合,可以大大减少外部存储器的使用,从而大幅降低AI芯片的功率预算。

比如,2801能够以1瓦特的能量计算每秒9.3万亿次运算,其中每次运算都是乘法累加的步骤。“这比英特尔的Movidius部件的能效比提高了90%。”

而面向数据中心的2803,则不仅可以用于推理而且可以用于训练,GTI采用马尔科夫链蒙特卡洛方法(Markov Chain Monte Carlo),即所谓的随机数递归,以代替更常见的SGD(随机梯度下降)以实现在APiM架构上快速进行模型训练。

2801和2803都采用了嵌入式存储器,2801的数量级为9Mb,与每个计算元件集成在一起的存储器允许芯片完成几乎所有的推理工作,而不必离开芯片到专门的存储器。该公司将其称为“内存中的AI处理”或“APiM”架构。

“我可以将网络模型和数据以及激活单元一次性预加载到芯片上吗,”杨林说道,“不必再与存储器进行频繁的数据输入与读出交换,能够节省大量功耗,这就是为什么性能是那么高。“

2802的另一个有趣特性:非易失性存储器。

2802用MRAM替换2801和2803部件中使用的静态RAM(SRAM)。与NAND闪存类似,MRAM在断电时不会丢失数据。这意味着神经网络可以由客户预先加载,甚至可能在工厂预装,然后部件出货。

在核心软件部分。与CPU和GPU不同,Gyrfalcon的专用集成电路(ASIC)没有现成的编程堆栈。

出于这个原因,该公司刚刚发布了一个开发人员SDK来为这些部件构建应用程序。开发套件可以在两个硬件配件上进行测试,包括一个名为“PLAI Plug”的USB计算棒和“PLAIWiFi”的独立设备,可作为移动端的无线加速设备使用。

沿袭杨林教授的并行矩阵计算思想,GTI展现超脱寻常的算力能力,但同时他们也采取了一个看起来稍显激进的模式——芯片的基础来自卷积神经网络,虽然卷积神经网络在过去几年中已经成为一些最重要的神经网络设计,但是这种选择使得芯片不太容易适用于其他类型的网络,例如“长期短期记忆”网络。

但GTI方面认为这并不是一种局限。

“CNN是所有其他AI的基础,”杨林在接受采访时说道。他指出,“我们发现最大的市场份额仍然由ResNet和MobileNet占据,我们需要做的是支持最主流的模型”。董琪认为,网络模型的形态并不决定真正的应用。试图覆盖所有现有的或即将到来的神经网络,会让AI专用芯片的性能变得平庸。

如果新的网络出现并占据了相当大的市场份额,“那么我们将为此推出另一种芯片,”他补充道。

据公开资料显示,2017年,一村资本母公司华西股份联合华天科技对GTI完成了首轮领投投资。据公开数据显示,Graphcore目前的融资资金超过1亿美元。

Gyrfalcon在采访中谈道,他们已经获得了“美国,日本,韩国和中国的机构和企业投资者的三轮融资”,并补充说“按目前的员工和费用率,公司有资金运营至少三年”。

(现场照片由驻海外记者Tony提供)

热门推荐:

恩智浦LPC54018物联网模块OM40007,让你的方案更快落地

德州仪器MSP-EXP430FR2355 LaunchPad开发套件,让设计开发简单直观

Microchip Technology SR087电源演示板,开关电源新选择

博世BMI088高性能IMU,和你一起改善飞行和导航体验

罗姆半导体SensorShield-EVK-003评估套件,一块“有种有料”的板子

Intel RealSense深度摄像头D400系列“更便捷的秘密”的等你来发现

Analog Devices EVAL-ADXL362评估板给开发设计者更多选择

Cypress Semiconductor PSoC6 BLE开发套件,美好的设计即将发生

STMicroelectronics VL53L1X飞行时间测距传感器,绝对测距无惧颜色和反射

NXP i.MX 8MQuad评估套件MCIMX8M-EVK ,一款开箱即用的高性能开发工具

英飞凌IM69D120和IM69D130 XENSIV MEMS麦克风,为低失真和高信噪比而设计

原文地址:https://www.eeboard.com/news/cnn-tesla10/

搜索爱板网加关注,每日最新的开发板、智能硬件、开源硬件、活动等信息可以让你一手全掌握。推荐关注!

【微信扫描下图可直接关注】

文章分页: 1 2 3 4

发表评论

相关文章

微软推离线翻译功能还无需安装特定的人工智能芯片

当我们在国外语言不通的时候,都希望手机上如果有一款方便的翻译应用就好了,然而虽说如今类似的应用并不少见,但多数都是需要联网才能使用,如果没信号的话就尴尬了。

PK华为NPU?阿里也进军人工智能芯片

近期中兴的紧急事态表明,对一个国家内的所有产业而言,掌握自主研发的上游技术是多么重要。在手机圈子里,华为起码有个自主研发的处理器海思麒麟,算是在某个程度上可以实现芯片自给自足,...

华为的3D传感技术能和iPhone X分庭抗礼了?

Cambou还表示,如果手机的脸部识别系统将会用于移动支付,我们永远可以争论哪种3D摄像头模块更安全,但有一件不可忽略的事情,就是中国因素。举例来说,最终只要支付宝认定哪种3D传感技术够...

盘点2018年即将上市的人工智能芯片

Rabaey在IEEE人工智能研讨会上表示:“我梦想的引擎,是可以随身携带,现场为我提供指导......我的目标是推动AI运行在小于100毫伏的运行。 我们需要重新思考我们如何做计算。 我们正在从基于...

三星几乎已经完成开发针对服务器的人工智能芯片 或随Galaxy S9亮相

1月18日消息,据《韩国先驱报》报道,知情人士透露,韩国科技巨头三星电子几乎已经完成其神经处理单元,即人工智能芯片的开发,这种芯片可帮助提高服务器和移动设备的人工智能软件处理能力。...