加入收藏 | 设为首页 | 会员中心 | 我要投稿 河北网 (https://www.hebeiwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 运营 > 正文

DeepMind新型AI训练技术与大脑的关系

发布时间:2020-01-29 18:29:10 所属栏目:运营 来源:站长网
导读:DeepMind前段时刻颁发了一篇论文,具体叙述了一种新开拓的强化进修,有但愿表明人类大脑中的夸奖通路是怎样运作的。据《新科学家》报道,这种呆板进修实习要领被称为“漫衍强化进修”,其背后的机制好像公道地表明白大脑神经元是怎样开释多巴胺的。 神经科

DeepMind新型AI实习技能与大脑的相关

DeepMind前段时刻颁发了一篇论文,具体叙述了一种新开拓的强化进修,有但愿表明人类大脑中的夸奖通路是怎样运作的。据《新科学家》报道,这种呆板进修实习要领被称为“漫衍强化进修”,其背后的机制好像公道地表明白大脑神经元是怎样开释多巴胺的。

神经科学和计较机科学有着久长的汗青。早在1951年,马文·明克斯就操作责罚制度缔造了一个可以或许破解迷宫的计较机措施。明克斯的灵感来自于心理学家伊万·巴甫洛夫的研究,巴甫洛夫证明白狗可以通过一系列的责罚法则来进修。Deepmind的这篇新论文通过应用一种强化进修来深入相识多巴胺神经元也许怎样施展浸染,从而为神经科学和计较机科学彼此交叉的汗青增加了新内容。

无论何时,当一小我私人或动物要做某件事时,大脑中认真开释多巴胺的神经元群就会猜测这一举动的回报。一旦这个举动被执行,而且这个举动的功效(嘉奖)变得明明,大脑就会开释多巴胺。然而,这种多巴胺的开释是按照猜测偏差的巨细来权衡的。假如嘉奖比预期的更大或更好,就会触发更凶猛的多巴胺激增。相反,较差的嘉奖会导致多巴胺开释镌汰。这与强化进修算法的运作方法很是相似。

DeepMind新型AI实习技能与大脑的相关

2017年,DeepMind的研究职员宣布了一种常用强化进修算法的加强版本,该进修要领可以或许进步很多强化进修使命的机能。DeepMind团队以为,新算法背后的机制可以用来更好地表明多巴胺神经元在人脑中的运作方法。为了研究多巴胺神经元的事变方法,DeepMind与哈佛大学相助,研究老鼠多巴胺神经元的勾当。

研究职员让老鼠执行各类使命,并按照掷骰子的方法给它们嘉奖,记录它们的多巴胺神经元是怎样激活的。差异的神经元好像猜测差异的隐藏功效,开释差异数目的多巴胺。一些神经元猜测的嘉奖低于现实嘉奖,而另一些神经元猜测的嘉奖高于现实嘉奖。在绘制出猜测嘉奖的漫衍之后,研究职员发明猜测的漫衍与真实的嘉奖漫衍很是靠近。

这表白当做出猜测并调解猜测以更好地与实际匹配时,大脑确实操作了分派体系。该研究可觉得神经科学和计较机科学提供信息,支持行使漫衍强化进修作为一种要领来建设更先辈的人工智能模子。除此之外,它还也许对我们的大脑怎样运作夸奖体系理论发生影响。

(编辑:河北网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读