现在的位置: 首页资讯>正文

通过添加机器学习可以大幅提升OpenAI机械手操控灵活性

2018年08月01日 作者: 暂无评论 425+ 0

虽然机器人的灵活性还没有达到接近人手的水平,但伊隆·马斯克等科技大佬携手创立的非营利组织 OpenAI,正在努力向这个目标抵近。最近,OpenAI 研究人员正在借助人工智能,来教导机器人像人类一样灵巧地操纵物体。通常情况下,科学家们需要通过强化学习来实现这一目标,即让 AI 反复试验学习过程,但这么做相当耗费时间。

如果只是让 AI 去学习怎么玩游戏,只需要让它以更快的速度玩游戏就行了。但涉及真实任务时,就有些抓瞎了。

你不能等待机械手臂经过多年的练习,且它难以模拟世界上足够准确的训练课目。

有鉴于此,OpenAI 自行设定了一个任务,教机器人手来操纵一个六面立方体 —— 将它从一个位置移动到另一个位置,期间保持特定的一面朝上。
与早期研究一样,他们首先尽可能地准确模拟这种环境,但下一步,他们会制造差异来搞乱模拟。

首先,研究人员添加了随机的‘视觉噪音’,改变械手和立方体的颜色。

然后,随机化立方体的大小、表面滑腻程度、重量、甚至模拟了不同的引力参数。
所有这一切,都是为了让 AI 更好地理解在现实世界中操纵立方体的可能性。

虽然模拟无法将真实情况完全考虑进去,但有了足够的变化,就允许它系统地学习针对意外事件的处理方法。参与 OpenAI 项目的 Matthias Plappert 解释到:

改变模拟的引力,是一件相当有趣的事情。当 AI 系统(Dactyl)在控制真实的机器人手时,手的基部可能每次都处于不同的位置和角度。

如果较低偏低,意味着立方体更容易从手中掉落。为了教 Dactyl 处理这种变化,研究人员决定将模拟中的重力参数也随机化。
如果不这样,它就会因为不习惯而一直掉落物体。事实上,Dactyl 必须积累大约 100 年的经验,才能达到最佳的表现。

反之,研究团队必须耗费大量的计算能力 —— 大约 6144 个 CPU 和 8 组强大的 Nvidia V100 GPU 。

显然,需求如此高的硬件,只有极少数的研究机构才能用上。不过 Plappert 表示,最终的结果,依然是相当值得的:

完成训练后,Dactyl 能够将立方体从一个位置移动到另一个位置,连续执行 50 次动作而不会出现掉落 —— 即便中位数的次数要小得多(只有 13 次)。
在学习移动立方体的过程中,Dactyl 甚至出了类似真人的行为,而所有这些都是在没有人为知道的情况下习得的(只是几十年如一日般的反复试验)。

Plappert 表示,这表明 OpenAI 的已经为仿真操控做到了极佳的优化。当你看到一台机器人试图解决问题,本身就是一件很有趣的事情。

原文地址:http://www.eeboard.com/news/openai-2/

搜索"爱板网"加关注,每日最新的开发板、智能硬件、开源硬件、活动等信息可以让你一手全掌握。推荐关注!
【微信扫描下图可直接关注】

发表评论

相关文章

胶质母细胞瘤通过AI治疗,可改进患者生活质量

美国研究人员新近开发出一种人工智能模型,能够为胶质母细胞瘤患者设计出最小剂量给药方案,在缩小肿瘤的同时减少药物带来的毒副作用,改进患者生活质量。

有趣精彩的表演OpenAI机械手

对 OpenAI 来说,这个项目是他们过去两年中追求的完整 AI 研发循环的最好体现:先开发新的强化学习算法,再拓展它的运行规模、在模拟环境中训练解决困难的问题,最后再把得到的系统应用在真...

谷歌推出AutoML,使神经网络设计降低门槛

在推出AutoML时,谷歌首席执行官Sundar Pichai在博客中写道:“设计神经网络是非常耗时的,其对专业知识的极高要求使得只有小部分科研人员和工程师才能参与设计。这就是我们创建AutoML方法的...

机器人短时间内积累了相当于100年的经验,可灵活地操纵物体

据外媒BGR报道,近日来自OpenAI实验室的研究人员已经教会机器人如何和人类一样灵活地操纵物体。OpenAI实验室获得埃隆·马斯克和彼得·泰尔等亿万富翁的支持。该项目在OpenAI研究论文(题为《学...

谷歌发布用于呼叫应用的AI系统

Contact Center AI可以说是展示了未来呼叫中心运行方式的其中一种方式。呼叫中心将首先让呼叫者跟人工智能代理联系并让后者为前者解决问题,但如果呼叫者更需要获更喜欢与人交谈,人工智能代...