博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
DeepMind发布新论文:嘈杂网络让智能体成为游戏大咖
阅读量:6811 次
发布时间:2019-06-26

本文共 749 字,大约阅读时间需要 2 分钟。

本文来自AI新媒体量子位(QbitAI)

近日,谷歌DeepMind团队的Meire Fortunato、Mohammad Gheshlaghi Azar、Bilal Piot等12人在ArXiv上发表了一篇新论文,主要探索了嘈杂网络(Noisy Networks, NoisyNet)以及在游戏中应用的表现。

量子位将论文中部分内容整理编译,与大家分享。

论文摘要

本文提出了NoisyNet,一种权重中增加了参数噪声的深度强化学习智能体,也证明了这种智能体策略的诱导随机性可被用来辅助有效探索。在NoisyNet中,噪声参数随着剩余网络权重一起学习梯度下降。

研究人员发现,用NoisyNet替代A3C、DQN、Dueling等算法智能体中的传统启发式探索,在多数Atari游戏中得分更高,一些情况下它也会胜过人类的表现,并且几乎没有额外的计算成本。

游戏大咖

研究人员用Atari的57个游戏对NoisyNet进行测试,并对比A3C、DQN和Dueling三种智能体的NoisyNet变体和基线对比结果。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

 三种智能体的NoisyNet变体和基线的表现性能比较

在上面的图中,横轴罗列了57个游戏,纵轴显示了表现性能的增长幅度,而图中能显示出来的最大增长幅度为250%。

值得注意的是,在NoisyNet-A3C变体的表现性能提升最为显著,在四个游戏中的性能提升均大于250%。

将上面的57个游戏的性能表现汇总,可以得出三种智能体的NoisyNet变体的整体数据。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

 整体数据图

可以看出,三种变体的性能平均值及中值都大大优于原始基线。

最后,附论文下载地址:

https://arxiv.org/abs/1706.10295

【完】

本文作者:安妮
原文发布时间:2017-07-05

转载地址:http://fykzl.baihongyu.com/

你可能感兴趣的文章
发布一个打飞机游戏
查看>>
Websocket 与 Socket.IO、Socket
查看>>
virtualization technology设置
查看>>
StackPanel 弹出菜单 ContextMenu
查看>>
Android FM模块学习之四源码分析(五)
查看>>
MySQL服务器安装完之后如何调节性能
查看>>
三个关键字
查看>>
TCP/IP详解学习笔记(9)-TCP协议概述
查看>>
【翻译】地形教程-简介
查看>>
什么是Docker
查看>>
生产CPU使用率180%问题排查
查看>>
一些 gem
查看>>
qt creator 添加调试工具
查看>>
springmvc拦截器
查看>>
三篇文章了解 TiDB 技术内幕 —— 谈调度
查看>>
JsonSort 对json排序
查看>>
MySQL常识篇
查看>>
一起学Java7新功能扩展——深入历险分享(一)
查看>>
关于parentNode和firstChild的一些坑
查看>>
JSP六种标准动作
查看>>