加入收藏 | 设为首页 | 会员中心 | 我要投稿 河北网 (https://www.hebeiwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长百科 > 正文

谷歌呆板人本身学会走路,完全无需人工过问

发布时间:2020-03-24 18:38:36 所属栏目:站长百科 来源:站长网
导读:小鹿在出生后异常钟内就能站起来,七个小时内就能学会走路。在可以或许站起来但还不会走路的这段时刻里,它会很是可爱、很是狂热地摆动它的四肢。 这就是人工智能呆板人背后的理念。固然自主呆板人和自动驾驶汽车一样,已经是一个被公共所熟知的观念,但自主学

小鹿在出生后异常钟内就能站起来,七个小时内就能学会走路。在可以或许站起来但还不会走路的这段时刻里,它会很是可爱、很是狂热地摆动它的四肢。

这就是人工智能呆板人背后的理念。固然自主呆板人和自动驾驶汽车一样,已经是一个被公共所熟知的观念,但自主进修呆板人如故只是一个假想。现有的强化进修算法固然可以或许让呆板人通过重复试验来进修举措,但仍严峻依靠于人工过问。每当呆板人摔倒或走出实习情形时,它照旧必要有人扶起它,并将它放回正确的位置。

最近,谷歌研究职员的一项新研究取得了重大盼望,呆板人可以在没有人工过问的环境下进修走路。在几个小时内,仅仅依赖对当前最先辈算法的微调,它们乐成地让一个四条腿的呆板人学会了完全独立的向前走和向后走,以及阁下转弯。

谷歌呆板人本身学会走路,完全无需人工过问

图 | 呆板人在差异的地形上进修自主行走,包罗平地(上)、影象泡沫床垫(中)和镂空的门垫(下) (来历:arxiv.org)

这项事变成立在一年前的研究基本上,其时研究团队初次发明白怎样让呆板人在实际天下中进修。

此前,强化进修凡是在模仿情形中举办:呆板人的假造两全在模仿的情形中走来走去,直到算法足够完美,可以使其安详运举动止。然后将其导入真正的呆板人。

这种要领有助于停止呆板人在重复尝试进程中对周围情形的损伤,但也必要一个易于建模的情形。在呆板人脚下模仿天然散落的沙砾可能弹簧床垫必要很长时刻,基础不值得。

基于这种状况,研究职员从一开始就抉择通过在真实天下中实习来停止坚苦的情形建模。他们计划了一种更高效的算法,可以使进修的试验次数变少一点,并在两个小时内让呆板人站起来行走。因为现真相形中会有天然变革,呆板人也可以或许快速顺应其他相似的情形,如斜坡、台阶以及有障碍的平地。

可是,这个进程如故必要人类去辅佐呆板人,并手动过问上百次,Google Brain 呆板人行为团队的认真人、论文合著者谭杰(音译)说,“一开始我没想过还必要人工过问。”

于是他们开始办理这个新题目。起首,他们限制了呆板人可以试探的地形,并让它一次性举办多重举措实习。假如呆板人在进修怎样向前走的同时达到了限制地形的边沿,它就会改变偏向,开始进修怎样向后走。

其次,研究职员还限定了呆板人的实习举措,让它可以或许审慎一些,最大限度地镌汰重复跌倒带来的危险。当呆板人不行停止地跌倒时,他们还添加了另一个硬编码算法来辅佐它站起来。

通过这些调解,呆板人学会了如安在几个差异的情形中自主行走,包罗平地、影象泡沫床垫和有误差的门垫。这项尝试给将来的某些应用带来了也许性,有些环境也许必要呆板人在没有人类的环境下在崎岖和未知的地形中行走。

斯坦福大学助理传授切尔西 芬恩(Chelsea Finn)暗示:“这项事变令人感想很是欢快。” 芬恩也为谷歌事变,但没有参加这项研究。“让这个进程不再呈现人工过问真的很难。呆板人可以或许更自主地进修,就更有也许在我们糊口的实际天下中进修,而不是在尝试室里。”

但她也提示到,今朝的配置依靠于呆板人上方的举措捕获体系来确定其位置。这在实际天下中是不行能的。

接下来,研究职员但愿他们的算法能合用于差异种类的呆板人,或合用于多个呆板人在统一情形中同时举办进修。谭杰信托,破解呆板人的举下手段将是解锁更多有效呆板人的要害。

“许多处所都是为人类制作的,我们都用腿来走路,” 他说,“假如呆板人学不会行使腿,它们就不能在人类天下中行走。”

-End-

编译:潘瑾

参考:

https://www.technologyreview.com/s/615303/ai-robot-learns-to-walk-autonomously-reinforcement-learning/

(编辑:河北网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读