现在的位置: 首页资讯>正文

通过添加机器学习可以大幅提升OpenAI机械手操控灵活性

2018年08月01日 作者: 暂无评论 558+ 0

虽然机器人的灵活性还没有达到接近人手的水平,但伊隆·马斯克等科技大佬携手创立的非营利组织 OpenAI,正在努力向这个目标抵近。最近,OpenAI 研究人员正在借助人工智能,来教导机器人像人类一样灵巧地操纵物体。通常情况下,科学家们需要通过强化学习来实现这一目标,即让 AI 反复试验学习过程,但这么做相当耗费时间。

如果只是让 AI 去学习怎么玩游戏,只需要让它以更快的速度玩游戏就行了。但涉及真实任务时,就有些抓瞎了。

你不能等待机械手臂经过多年的练习,且它难以模拟世界上足够准确的训练课目。

有鉴于此,OpenAI 自行设定了一个任务,教机器人手来操纵一个六面立方体 —— 将它从一个位置移动到另一个位置,期间保持特定的一面朝上。
与早期研究一样,他们首先尽可能地准确模拟这种环境,但下一步,他们会制造差异来搞乱模拟。

首先,研究人员添加了随机的‘视觉噪音’,改变械手和立方体的颜色。

然后,随机化立方体的大小、表面滑腻程度、重量、甚至模拟了不同的引力参数。
所有这一切,都是为了让 AI 更好地理解在现实世界中操纵立方体的可能性。

虽然模拟无法将真实情况完全考虑进去,但有了足够的变化,就允许它系统地学习针对意外事件的处理方法。参与 OpenAI 项目的 Matthias Plappert 解释到:

改变模拟的引力,是一件相当有趣的事情。当 AI 系统(Dactyl)在控制真实的机器人手时,手的基部可能每次都处于不同的位置和角度。

如果较低偏低,意味着立方体更容易从手中掉落。为了教 Dactyl 处理这种变化,研究人员决定将模拟中的重力参数也随机化。
如果不这样,它就会因为不习惯而一直掉落物体。事实上,Dactyl 必须积累大约 100 年的经验,才能达到最佳的表现。

反之,研究团队必须耗费大量的计算能力 —— 大约 6144 个 CPU 和 8 组强大的 Nvidia V100 GPU 。

显然,需求如此高的硬件,只有极少数的研究机构才能用上。不过 Plappert 表示,最终的结果,依然是相当值得的:

完成训练后,Dactyl 能够将立方体从一个位置移动到另一个位置,连续执行 50 次动作而不会出现掉落 —— 即便中位数的次数要小得多(只有 13 次)。
在学习移动立方体的过程中,Dactyl 甚至出了类似真人的行为,而所有这些都是在没有人为知道的情况下习得的(只是几十年如一日般的反复试验)。

Plappert 表示,这表明 OpenAI 的已经为仿真操控做到了极佳的优化。当你看到一台机器人试图解决问题,本身就是一件很有趣的事情。

原文地址:https://www.eeboard.com/news/openai-2/

搜索"爱板网"加关注,每日最新的开发板、智能硬件、开源硬件、活动等信息可以让你一手全掌握。推荐关注!
【微信扫描下图可直接关注】

发表评论

相关文章

2018谷歌开发者大会(中国上海),重点布局3个领域为开发者指明方向

2018,9月20号~9月21号,谷歌开发者大会在上海如期举行。今年是谷歌开发者大会在中国举办的第二年,与往年一样,谷歌展示了最新的技术和成果,以及一些电子商务模式、广告业务的推广等。不过...

想学AI和机器学习的人,这 6 个领域你不得不懂!

近期热门的话题, 人们开始重新讨论这一基本定义----什么是人工智能(AI)。有些人将 AI 重新命名为「认知计算」或「机器智能」,而其他人则错误地将 AI 与「机器学习」概念进行交换。在某种...

盘点2018年不可错过的30个激动人心的机器学习项目

开放源码项目对数据科学家很有用。而你也可以通过阅读源代码这一方式来学习,并在这些现有项目的基础上构建一些新的内容。给自己足够的时间去尝试一下这些去年你可能错过的激动人心的机器学...

加密方法层出不穷,破解方法也在与时俱进啊!——声波追踪破解

虽然生物解锁的方式越发丰富了,但无论指纹、刷脸还是虹膜等,都还需要同步设置一个4~6位的PIN码。安全机构发现,破解PIN码有了更省时省力的方法。

谷歌未来增长的动力来自于人工智能和机器学习

谷歌未来增长的动力来自于人工智能和机器学习,以及如何有效地利用这些技术加强其子公司业务,这些将决定谷歌的盈利增长方式。