现在的位置: 首页资讯>正文
通过添加机器学习可以大幅提升OpenAI机械手操控灵活性
2018年08月01日 作者: 暂无评论 65+ 0

虽然机器人的灵活性还没有达到接近人手的水平,但伊隆·马斯克等科技大佬携手创立的非营利组织 OpenAI,正在努力向这个目标抵近。最近,OpenAI 研究人员正在借助人工智能,来教导机器人像人类一样灵巧地操纵物体。通常情况下,科学家们需要通过强化学习来实现这一目标,即让 AI 反复试验学习过程,但这么做相当耗费时间。

如果只是让 AI 去学习怎么玩游戏,只需要让它以更快的速度玩游戏就行了。但涉及真实任务时,就有些抓瞎了。

你不能等待机械手臂经过多年的练习,且它难以模拟世界上足够准确的训练课目。

有鉴于此,OpenAI 自行设定了一个任务,教机器人手来操纵一个六面立方体 —— 将它从一个位置移动到另一个位置,期间保持特定的一面朝上。
与早期研究一样,他们首先尽可能地准确模拟这种环境,但下一步,他们会制造差异来搞乱模拟。

首先,研究人员添加了随机的‘视觉噪音’,改变械手和立方体的颜色。

然后,随机化立方体的大小、表面滑腻程度、重量、甚至模拟了不同的引力参数。
所有这一切,都是为了让 AI 更好地理解在现实世界中操纵立方体的可能性。

虽然模拟无法将真实情况完全考虑进去,但有了足够的变化,就允许它系统地学习针对意外事件的处理方法。参与 OpenAI 项目的 Matthias Plappert 解释到:

改变模拟的引力,是一件相当有趣的事情。当 AI 系统(Dactyl)在控制真实的机器人手时,手的基部可能每次都处于不同的位置和角度。

如果较低偏低,意味着立方体更容易从手中掉落。为了教 Dactyl 处理这种变化,研究人员决定将模拟中的重力参数也随机化。
如果不这样,它就会因为不习惯而一直掉落物体。事实上,Dactyl 必须积累大约 100 年的经验,才能达到最佳的表现。

反之,研究团队必须耗费大量的计算能力 —— 大约 6144 个 CPU 和 8 组强大的 Nvidia V100 GPU 。

显然,需求如此高的硬件,只有极少数的研究机构才能用上。不过 Plappert 表示,最终的结果,依然是相当值得的:

完成训练后,Dactyl 能够将立方体从一个位置移动到另一个位置,连续执行 50 次动作而不会出现掉落 —— 即便中位数的次数要小得多(只有 13 次)。
在学习移动立方体的过程中,Dactyl 甚至出了类似真人的行为,而所有这些都是在没有人为知道的情况下习得的(只是几十年如一日般的反复试验)。

Plappert 表示,这表明 OpenAI 的已经为仿真操控做到了极佳的优化。当你看到一台机器人试图解决问题,本身就是一件很有趣的事情。

原文地址:http://www.eeboard.com/news/openai-2/

搜索"爱板网"加关注,每日最新的开发板、智能硬件、开源硬件、活动等信息可以让你一手全掌握。推荐关注!
【微信扫描下图可直接关注】

发表评论

相关文章

谷歌欲与美军方的合作:利用机器学习技术分析无人机采集的视频数据

谷歌无意放弃与美军方的合作,部分员工放弃抗争 谷歌员工认为此次与美国军方合作的机器学习项目有违该公司长期以来坚持的信条,即“不作恶”。该项目名称为Project Maven,旨在利用机器学习技...

介绍Waymo如何借助机器学习技术减少雪花带来的“信号噪点”

北京时间 5 月 9 号凌晨,谷歌拉开了 I/O 2018 开发者大会的序幕。主题演讲期间,该公司浓墨重彩地介绍了人工智能在各个领域的应用,比如 Waymo 是如何借助机器学习技术减少雪花带来的“信号...

Google发布第三代AI专用处理器TPU 3.0:性能暴涨8倍

Google I/O 2018开发者大会期间,Google正式发布了第三代AI人工智能/机器学习专用处理器TPU 3.0。TPU也就是Tensor Processor Unit,Google为机器学习定制的专用芯片(ASIC),专为Google的深度...

人和人吵架常见, 但你见过 AI 和 AI 吵架吗?

最后我们认为如果辩论或类似的方法有效,那么即使以后人类无法直接监督 AI 系统,它也会使未来的人工智能系统更安全,因为这种方法可以使 AI 系统与人类的目标和价值取向保持一致。 即使对于...

未来iOS系统将配备更高级的Siri智能私人助理,更加精确识别设备主人

日前,苹果在自家机器学习刊物《Apple Machine Learning Journal》上发表最新一篇文章,主要是关于用户在iOS设备上激活“嘿Siri”功能时的人性化过程。