现在的位置: 首页资讯>正文

GTC真的有那么糟么?看似槽点、其实亮点:“世界最大的GPU”

2018年03月29日 作者: 暂无评论 1,546+ 0

GPUBuy more GPU,save more money!(买越多GPU,省越多钱!)上面这句话,英伟达CEO黄仁勋在整场GTC中足足重复了9次(可能还有数漏的)。

作为英伟达每年最重要的大会,一年一度在美国旧金山举办的GTC一直都是英伟达技术实力最集中的展示。这些技术实力往往覆盖多个方向,大家关注最多的无疑是“新核弹”,更通俗的说——全新的GPU架构、更强大的GPU等等。

事实上,他们都“缺席”了本次GTC 2018。或许是受此影响,再加上美股大盘整体下挫,英伟达股价在整场GTC进行期间不断下滑,截止发稿整体跌幅已经超过7%。

这样的股价表现,不由得让人们心中浮现一个问题——这次GTC真的有那么糟么?(事实上,有部分友媒已经开始发文看衰英伟达了,但这样的判断真的是对的么?)为了解答这个问题,我们首先有必要先重新一下黄仁勋在本次GTC Keynote中提及的各种内容。

看似槽点、其实亮点:“世界最大的GPU”GPU

正如上文所提到的,本次GTC之上没有像之前大家预期的那样,发布全新的GPU架构,以及传统定义上的“核弹”(单颗GPU、或者单显卡封装的产品)。GPU

但英伟达实际上拿出了一款被黄仁勋自己称为“全球最大的GPU”的新产品——DGX-2。GPU

组件强的不像话的DGX-2

去年发布Volta架构之时,英伟达实际上已经将DGX-1中原有的P100 GPU换成了V100 GPU。原有的V100 GPU已经很强大了,那么想要更强大就只剩一种“简单而又粗暴”的方法了:再加几颗V100 GPU,这也是为啥在DGX-2服务器加速器中你会看到有16颗V100 GPU。GPU

16颗GPU中任何两颗都能以300GB/s进行数据交换

GPU数量是翻倍了,但要想将他们发挥出真正的威力,英伟达还祭出了一项升级版的技术NVLink Switch(简称NV Switch)。这项技术的目标只有一个:让DGX-2中的16颗V100 GPU能够化身为一颗巨大的“GPU”运作。

根据英伟达副总裁和DGX系统产品经理Jim McHugh介绍,因为NVswitch技术,DGX-2中的16颗GPU之间都能够直接1对1连接传输,每颗GPU拥有高达50Gb/s的带宽,同时最多支持18颗GPU相互连接,让整个系统的吞吐性能达到惊人的900Gb/s。GPU

现场减价“促销”

最后是整个系统的售价,黄仁勋现场表示展示用的这套实验产品实际上价值250万美元,然后先放出了一个150万美元的售价,在最后一秒直接自己“砍到”了39.99万美元。GPU

高举着两倍显存的Quadro GV100加速器的黄仁勋

值得一提的是,DGX-2中使用的虽然还是V100 GPU,但它发生了一点小变化——原有的4颗4GB HBM2显存,升级为4颗8GB HBM2显存,也让V100 GPU的整体显存大小升级为32GB。(GPU其他参数,包括显存位宽、带宽均没有改变。)而在DGX-2中,16个V100 GPU中各自拥有的32GB显存都将连接到一起,你甚至可以将它看成一整个512GB的显存空间。

那么究竟这对于用户来说有多大的影响呢?英伟达官方的原话是:“显存容量增加,让运行更深、更大的深度学习模型成为可能,同时也会提升深度学习的表现。对于内存大小比较敏感的应用,最多能够提升50%的实际表现。”GPU

黄仁勋:对于他这样的工程师来说,DGX-2太“sex”了

抛开DGX-2的性能本身、抛开DGX-2在各种深度学习解决方案的性价比等等,英伟达在DGX-2上所采取的新策略或许更值得思考:并行架构先天拥有优秀的扩展性,英伟达似乎在传统的GPU架构、芯片制程之外找到了一个延续性更强的性能增长路线。

当然从另外一个方面来讲,通过数量的叠加,设备的性能的确可以快速增长,但如何实现数块GPU之间的大量数据吞吐、同时保证这些新添加的数据传输能力不会造成太高的成本、以及更多的功耗,将会是这一种路线的挑战。

高速、高效,让自动驾驶路测走向VR时代GPU

GPUDrive Constellation的实际系统组成(下图)

文章分页: 1 2

发表评论

相关文章

Imagination发布神经网络加速器和第九代GPU新品PowerVR 9XEP、 9XMP和9XTP

去年,Imagination失去最大客户苹果引发业界巨大的关注,最终Imagination被Canyon Bridge收购成为了一家中资公司。Imagination被收购之后财务非常稳健,并且越来越重视中国市场。12月4日,Im...

深度学习已死?完全夸大其词,深度学习是AI发展的下一个阶段

英特尔副总裁在受访时表示,“深度学习已死”这类报道完全属于夸大其词,深度学习是AI发展的下一个阶段,英特尔预计在2020年将深度学习技术应用在日用品和可穿戴设备上。

乐高定制的自动驾驶汽车,未来的路又该怎么走呢?

计算机一直以来都是可定制的。在个人电脑的早期阶段,DIYers便可在线订购主板,CPU和其他部件,进而将自己的个人计算机整合在一起。对于游戏玩家,工程师和计算机爱好者来说,他们要求特定组...

浅析自动驾驶运算控制系统以及无人驾驶的“大脑”和“小脑”

IT行业在近期以及未来一段时间与国家经济战略密切相关,美国国会先后发布关于中国黑客对美国高科技企业实施“硬件植入”的虚假报告,美国国务卿落地北京三小时即离去的新闻。再加上今年四月份...

自动驾驶汽车缺了 5G就真的“活不下去”吗?

5G 网络的忠实拥趸们相信,这项新技术不但能提供比 4G 网络更快的连接和数据下载能力,还能处理更为海量的通信任务,而正在一步步走向成熟的自动驾驶汽车,未来也需要 5G 网络的“辅佐”。