OpenAI为机器人灵活性设定新的基准

作者:【*】

2019-05-10 17:11:26 来源:【互联网】  浏览量:

字号

这个世界上没有任何东西 - 动物或机器人 - 非常接近人手的灵活性和灵活性。对于Elon Musk创立的非营利组织OpenAI的工程师来说,这既是挑战也是机遇。他们的研究人员如何使用人工智能来教导机器人像人一样巧妙地操纵物体?

OpenAI为机器人灵活性设定新的基准

通常,在教授AI来控制物理机器人时,科学家们往往会遇到同样的问题。培训通常使用强化学习来完成; AI通过反复试验过程学习的方法。但这需要很多时间,通常相当于多年的经验。如果你想让AI击败一个视频游戏,那就没关系了 - 你只是让它以更快的速度玩游戏。但如果你想教它一个真实的任务,那你就麻烦了。你不能等待机器人手臂经历多年的练习,并且很难模拟世界上足够准确的训练目的。

对于OpenAI,他们自己设定的任务是教一个机器人手来操纵一个六面立方体; 将它从一个位置移动到另一个位置,使特定的一面朝上。与早期的研究一样,他们首先尽可能准确地模拟这种环境,但他们的下一步是产生差异:他们开始搞乱模拟。

首先,他们添加了随机视觉噪音。然后,他们改变了虚拟手和立方体的颜色。他们随机化了立方体的大小; 它的表面有多滑; 它有多重 他们甚至搞砸了模拟的引力。所有这一切的效果是让AI更好地理解在现实世界中操纵立方体的可能性。虽然模拟可能不完全真实,但它有足够的变化,它允许系统学会处理意外。

参与该项目的OpenAI的Matthias Plappert解释说,改变模拟的引力是一个特别有趣的黑客。该团队知道,当AI系统(称为Dactyl)正在控制一个真正的机器人手时,手的基部每次可能不会以相同的角度定位。较低的角度意味着立方体将更容易从手中掉落。为了教Dactyl如何处理这个变体,他们决定将模拟中的重力随机化。“没有这种随机化,它就会一直丢弃物体,因为它不习惯它,”Plappert说。

通过所有这些随机化需要很长时间。很长一段时间。事实上,Dactyl必须积累大约100年的经验才能达到最佳表现。反过来,这意味着团队必须使用大量的计算能力 - 大约6,144个CPU和8个强大的强大Nvidia V100 GPU。这种硬件只有极少数研究机构才能使用。

但最终的结果是值得的,Plappert说。完成训练后,Dactyl能够将立方体从一个位置移动到另一个位置,连续50次,而不会掉落。(尽管它这样做的中位数要小得多;只有13个。)在学习手中移动立方体的过程中,Dactyl甚至开发了类似人类的行为。所有这些都是在没有任何人为指导的情况下学到的 - 只是反复试验,几十年一次。

“这表明我们人类对操控的作用非常优化,”Plappert说。“当你看到一个试图解决问题的机器人时,这是一个非常有趣的时刻,你会想'噢,嘿,那也是我会这样做的。'”

机器人技术和人工智能领域的专家对The Verge的评论赞扬了OpenAI的工作,但警告说它并不代表机器人操纵的突破。卡内基梅隆大学机器人研究所的Smruti Amarjyoti指出,随机化系统训练环境的想法之前已经完成,但是说Dactyl的动作是“优雅的”,他认为AI是不可能的。

“最终的结果是非常复杂和精致,”Amarjyoti说。“[但]我认为OpenAI在这一领域的最大成就将是它所采用的工程协调以及用于实现这一壮举的计算能力。”

Istituto Italiano di Tecnologia的机器人学教授安东尼奥·比奇(Antonio Bicchi)表示,这项研究“优雅而令人着迷”,但指出了一些局限性。“结果仍然局限于一个特定的任务(滚动一个方便大小的模具)在相当有利的条件下(手朝上,所以骰子落在掌中),甚至不是一个确凿的论据,这些技术可以解决现实世界的机器人问题,“比奇说。

对于OpenAI来说,研究对于Dactyl骰子杂耍之外的原因是令人满意的。该系统使用了许多与实验室开发的相同算法和技术来教授其视频游戏机器人 OpenAI Five。该公司建议,这表明它正在构建通用算法,可以用来处理各种各样的任务 - 对于雄心勃勃的AI实验室和公司来说,这是一个圣杯。

在人工智能的帮助下创建更灵巧的机器人对于尝试自动化手工劳动的公司来说将是一个巨大的福音,并且有许多初创公司积极地在该领域进行研究。但是,虽然提高机器人技术的先进水平当然可以让更多的工作岗位自动化,但是这种工作破坏浪潮是否可以被新技术创造的工作所抵消,这是一个悬而未决的问题。

无论哪种方式,很明显人工智能仍然有一条路可以匹配人类的运动技能。Bicchi指出,使用Dactyl将近百年学习的能力可以被“只有极少数试验,甚至是新物体和任务的人”所接受。但当然机器正在赶上,比以往任何时候都要快。


工业电器网版权与免责声明: ① 凡本网注明"来源:工业电器网"的所有作品,版权均属于工业电器网,未经本网授权不得转载、摘编或利用其它方式使用。已获本网授权的作品,应在授权范围内使用,并注明"来源:工业电器网"。违者本网将追究相关法律责任。 ② 本网凡注明"来源:xxx(非本网)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,且不承担此类作品侵权行为的直接责任及连带责任。如其他媒体、网站或个人从本网下载使用,必须保留本网注明的"稿件来源",并自负版权等法律责任。 ③ 如涉及作品内容、版权等问题,请在作品发表之日起两周内与本网联系,否则视为默认工业电器网有权转载。
关注工业电器网微信公众号