现在的位置: 首页资讯>正文

小米也开源,MACE任你玩

2018年07月24日 作者: 暂无评论 672+ 0

6月28日,小米人工智能与云平台副总裁崔宝秋博士在开源中国开源世界高峰论坛上发表《小米 AI 时代的开源》演讲,并在会上宣布,开源小米自研的移动端深度学习框架 Mobile AI Compute Engine (MACE)。

地址:https://github.com/XiaoMi/mace

近年来,随着移动互联网的深入发展和IoT智能设备的普及,以及用户对智能性,低延迟和隐私保护的诉求变得越来越高,移动设备上的离线深度学习应用变得越来越普遍。

MACE 是专门为移动设备优化的深度学习模型预测框架,MACE 从设计之初,便针对移动设备的特点进行了专门的优化:

速度:对于放在移动端进行计算的模型,一般对整体的预测延迟有着非常高的要求。在框架底层,针对ARM CPU进行了NEON指令级优化,针对移动端GPU,实现了高效的OpenCL内核代码。针对高通DSP,集成了nnlib计算库进行HVX加速。同时在算法层面,采用Winograd算法对卷积进行加速。
功耗:移动端对功耗非常敏感,框架针对ARM处理器的big.LITTLE架构,提供了高性能,低功耗等多种组合配置。针对Adreno GPU,提供了不同的功耗性能选项,使得者能够对性能和功耗进行灵活的调整。
系统响应:对于GPU计算模式,框架底层对OpenCL内核自适应的进行分拆调度,保证GPU渲染任务能够更好的进行抢占调度,从而保证系统的流畅度。
初始化延迟:在实际项目中,初始化时间对用户体验至关重要,框架对此进行了针对性的优化。
内存占用:通过对模型的算子进行依赖分析,引入内存复用技术,大大减少了内存的占用。
模型保护:对于移动端模型,知识产权的保护往往非常重要,MACE支持将模型转换成C++代码,大大提高了逆向工程的难度。
此外,MACE 支持 TensorFlow 和 Caffe 模型,提供转换工具,可以将训练好的模型转换成专有的模型数据文件,同时还可以选择将模型转换成C++代码,支持生成动态库或者静态库,提高模型保密性。

目前MACE已经在小米手机上的多个应用场景得到了应用,其中包括相机的人像模式,场景识别,图像超分辨率,离线翻译(即将实现)等。

此外,随着MACE一起开源的还有 MACE Model Zoo 项目,目前包含物体识别,场景语义分割,图像风格化等多个公开模型。后续会增加更多模型。

上方是用MACE Model Zoo中的fast style transfer(快速风格迁移)模型在手机端生成的风格化图片。

此前小米曾参与多个国际重大的开源项目,比如Hadoop,HBase,Spark,TensorFlow等,同时,小米也积极参与自研、具有通用性的软件系统。过去几年,小米相继推出了Linden(分布式实时搜索系统),Open-Falcon(互联网企业级监控系统)、Pegasus(分布式KV存储系统)等一系列开源项目。

在AI方面,小米开源了自研的针对移动端设备优化的深度学习框架 MACE,目前已经支持内部的多个业务。

原文地址:https://www.eeboard.com/news/xiaomi-opensource-mace-github/

搜索"爱板网"加关注,每日最新的开发板、智能硬件、开源硬件、活动等信息可以让你一手全掌握。推荐关注!
【微信扫描下图可直接关注】

发表评论

相关文章

华为要搞事情!AI芯片或10月面世

华为近年来最大的动作将在10月份揭晓。据了解,华为的秘密行动“达芬奇计划(也叫D计划)”,将在10月10日的华为全连接(HC)大会上揭开最终答案,其中包括两项重要的发布:华为云数据中心AI芯...

英特尔携手人工智能技术助力乳腺癌筛查及诊治

2018时尚健康粉红丝带运动暨英特尔智慧医疗主题沙龙举行,英特尔公司携手时尚集团《时尚健康》,共同发起以“爱护乳腺,AI不宜迟”为主题的乳腺癌防治活动。会上,英特尔与国家级医疗影像人工...

你们落后了吗?有多少企业在用TensorFlow?

TensorFlow,即谷歌的深度学习框架,针对目前越来越多终端的AI应用,TensorFlow衍生出TensorFlow Lite,在保证精度的同时进一步缩减模型体量,便于在终端实现边缘计算。

垄断AI芯片:Facebook揭秘深度学习编译器Glow

一名 Facebook 高管在最近的一次活动中证实,这家社交网络巨头正在招募芯片工程师,并已在设计至少一种 ASIC。在本周的 Facebook @Scale 2018 大会上,Facebook 宣布五家芯片公司将支持 Glow...

教你如何在树莓派上实现深度学习目标检测

这个现实世界造成了很多挑战,比如数据有限、只有微型的计算机硬件(像手机、树莓派)所造成的无法运行复杂深度学习模型等。这篇文章演示了如何使用树莓派来进行目标检测。就像路上行驶的汽...