现在的位置: 首页资讯>正文

支持创造性革新的背后,苹果团队面临了哪些挑战?

2017年11月21日 作者: 暂无评论 528+ 0

 iPhone苹果 Vision 框架的发布,意味着开发者可以在 App 中使用深度学习算法和许多其他的计算机视觉技术。那么,支持这一创造性革新的背后,苹果团队面临了哪些挑战?日前,苹果在其官网发文,首次揭露了这些信息。详情如下,爱板网编译整理:

苹果在 iOS 10 中开始使用深度学习技术。随着 Vision 框架的发布,开发者可以在 App 中使用深度学习技术和许多其他的计算机视觉算法。他们在开发 Vision 框架时,为了保护用户隐私,让算法能高效执行,面临着巨大的挑战。下面是对这些挑战的介绍。

苹果公司首先通过 CIDetector 类在 Core Image 框架中发布了人脸检测公共 API 。苹果内部应用程序也在使用这个 API ,例如 Photo 。CIDetector 最早版本使用的是一种基于 Viola-Jones 的检测算法,基于传统计算机视觉技术的进步,CIDetector 得到了持续改进。

随着深度学习的出现以及它在计算机视觉问题上的应用,这些顶尖技术在人脸检测的精准性上取得了前所未有的巨大进步。为了利用这些技术的所带来的转变,苹果彻底重新思考他们的方法。

与传统的计算机视觉相比,在深度学习中学到的模型需要更大的内存、更大的磁盘存储空间和更多的计算资源。

虽然手机发展到现在,已经具备各种各样的功能了,但传统的高端手机并不是一个适合训练深度学习视觉模型的平台。大多数行业通过云端的 API 提供深度学习解决方案来解决这个问题。在那种云端解决方案中,图像被发送到云端服务器,然后再利用深度学习来推理、检测人脸。

云端的服务通常使用性能强大的桌面级 GPU,具有大量可用内存。当碰到非常大的网络模型,或者可能要配置大型模型时,都可以在服务器端运行,这能保证客户端(可能是移动电话)可以在云端(在本地无法运行)运行大型的深度学习架构。

苹果 iCloud 照片库是一个基于云端的图片和视频存储解决方案。不过,由于苹果此前做出过承诺,绝不侵犯用户隐私,所以他们不能利用 iCloud 服务器来进行计算机视觉计算。所有发送到 iCloud 照片库的照片和视频在发送到云存储之前就在设备上进行了编码,而且只能通过注册过那个 iCloud 账户的设备进行解密。因此,为了带来深度学习的计算机视觉解决方案,必须直面在 iPhone 上运行深度学习算法的挑战。

除了这一点外,苹果还面临诸多挑战。

深度学习模型需要装配到操作系统中去,占用本来就很稀缺的 NAND 存储空间。

此外,它还需要加载到 RAM 中,使得 GPU/CPU 的计算时间大大延长。

与云端的服务不同,云上的资源可以分配,可以用来单独解决视觉问题,而想要在设备上进行计算,则需要在与其他正在运行的应用程序共享系统资源。

最后,计算必须足够高效,能够在相当短的时间内处理大型图片库,并且手机的电量不会消耗得过快,手机也不能产生明显发热。

原文地址:http://www.eeboard.com/news/iphone-141/

搜索爱板网加关注,每日最新的开发板、智能硬件、开源硬件、活动等信息可以让你一手全掌握。推荐关注!

【微信扫描下图可直接关注】   aibanwang

发表评论

相关文章

重磅!树莓派正式支持谷歌深度学习框架TensorFlow

树莓派的最新版本系统正式支持TensorFlow,让每个开源硬件爱好者都能享受深度学习的乐趣! 2015年,谷歌TensorFlow推出,从此,它一直致力于成为每一个人的开源深度学习工具。 长期以来,经...

小米也开源,MACE任你玩

6月28日,小米人工智能与云平台副总裁崔宝秋博士在开源中国开源世界高峰论坛上发表《小米 AI 时代的开源》演讲,并在会上宣布,开源小米自研的移动端深度学习框架 Mobile AI Compute Engine ...

AMD发布首款7nm GPU:专为深度学习和人工智能处理添加了优化

在宣布了核心数碾压英特尔的二代“线程撕裂者”高端台式处理器之后,AMD 又在台北电脑展(Computex 2018)的舞台上演示了全球首款 7nm GPU 。

NVIDIA推HGX-2超级计算机,为人工智能、深度学习进行服务

16路Tesla V100计算卡!NVIDIA为AI应用推出HGX-2超算 在台北Conputex开幕前夕,NVIDIA年度技术大会GTC在台北举行。会议前的Keynote上,NVIDIA的CEO黄仁勋宣布推出全新的HGX-2超级计算机,将...

英特尔推OpenVINO,将计算机图形和深度学习推理整合到前沿的视觉应用

在接受外媒ZDNet采访的时候,英特尔高管Adam Burns表示:“构建智能的不只是一种架构。”OpenVINO提供了一组已经优化的能力和runtime引擎,能够允许开发者在架构上运行自己的模型,无论是FPGA...