收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

RoboCup仿真比赛中机器学习问题的研究

潘凌寒  程显毅  
【摘要】:未来50年中,人工智能的主要问题是“多主体动态不可预测环境中的问题求解”,其标准问题是足球的机-机对抗赛和人-机对抗赛。本文采用强化学习方法研究了RoboCup仿真比赛中的足球机器人的踢球问题,并提出了基于多智能体的强化学习方法,最后给出了实验结果。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 卞凯;;基于强化学习的城市交通区域协调控制研究[J];电子技术;2011年08期
2 夏丽丽;;连续状态-连续行动强化学习[J];电脑知识与技术;2011年19期
3 祝宇虹;毛俊鑫;;基于人工情感与Q学习的机器人行为决策[J];机械与电子;2011年07期
4 刘卫红;周义莲;;强化学习方法在Web服务组合中的应用比较研究[J];计算机应用与软件;2011年07期
5 黄付亮;张荣国;陈大川;刘焜;;基于联合博弈的多Agent学习[J];计算机与数字工程;2011年06期
6 张文柱;邵丽娜;;异构无线网络中基于强化学习的频谱管理算法[J];西安电子科技大学学报;2011年04期
7 侯艳丽;;基于支持向量机和Q学习的移动机器人导航[J];计算机工程与应用;2011年23期
8 李昭阁;;强化学习,更新观念,发挥校园网作用[J];学周刊;2011年12期
9 常晓军;;基于联合强化学习的RoboCup-2D传球策略[J];计算机工程与应用;2011年23期
10 冯侦探;尤佳莉;倪宏;;P2P VOD系统邻居节点查找算法[J];计算机工程与应用;2011年24期
11 王世进;;面向制造任务动态分配的改进合同网机制[J];计算机集成制造系统;2011年06期
12 刘一松;李倩倩;;一种最优规划程序设计语言OPPLFC[J];计算机应用研究;2011年08期
13 蔡建羡;阮晓钢;;基于遗传算法的Skinner操作条件反射学习模型[J];系统工程与电子技术;2011年06期
14 左敏;曾广平;涂序彦;魏伟;;基于平行进化的机器人智能控制研究[J];计算机仿真;2011年08期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 方宝富;王浩;姚宏亮;杨静;周晋;;Q学习在机器人足球中的应用[A];2004中国机器人足球比赛暨学术研讨会论文集[C];2004年
2 张衡;程显毅;张吉刚;陈小波;;基于Q学习的足球机器人协作策略[A];2005中国机器人大赛论文集[C];2005年
3 杨茂;田彦涛;杨永明;刘宗春;;基于改进粒子群优化算法的多机器人合作Q学习[A];2009年中国智能自动化会议论文集(第二分册)[C];2009年
4 杜春侠;;基于模糊先验知识的Q学习及在足球机器人系统中的应用[A];2004中国机器人足球比赛暨学术研讨会论文集[C];2004年
5 杨善林;罗贺;胡小建;;基于Q学习的自主Agent模型[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年
6 宋楠;赵忠文;刘帅;戴迎春;;基于势能场的MAS局部合作Q学习算法[A];第十六届全国青年通信学术会议论文集(上)[C];2011年
7 文锋;陈宗海;陈春林;;基于RLS-TD和值梯度的强化学习方法用于LQR控制问题[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
8 卓睿;陈宗海;陈春林;;强化学习在移动机器人导航上的应用[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
9 马洁;李茂;邱国霞;张志涌;;Q学习在RoboCup个体技术中的应用[A];2005中国机器人大赛论文集[C];2005年
10 张伟;李建更;张家旺;;多智能体强化学习在机器人足球比赛中的应用[A];2005年中国智能自动化会议论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 金钊;加速强化学习方法研究[D];云南大学;2010年
2 陈圣磊;强化学习及其在MAS协同概念设计中应用的研究[D];南京理工大学;2006年
3 徐明亮;强化学习及其应用研究[D];江南大学;2010年
4 陈学松;强化学习及其在机器人系统中的应用研究[D];广东工业大学;2011年
5 仲宇;分布式强化学习理论及在多机器人中的应用研究[D];哈尔滨工程大学;2003年
6 李誌;基于视觉听觉语义相干性的强化学习系统的研究[D];太原理工大学;2012年
7 郭庆;多Agent系统协商中若干关键技术的研究[D];浙江大学;2003年
8 戴朝晖;基于混合抽象机制的多智能体系统动态分层强化学习算法研究[D];中南大学;2012年
9 杨东勇;多机器人协作的学习与进化方法[D];浙江大学;2005年
10 庄晓东;多移动机器人运动控制策略的强化学习研究[D];中国海洋大学;2005年
中国硕士学位论文全文数据库 前10条
1 董友球;基于强化学习的区域交通控制方法研究[D];五邑大学;2008年
2 尹晓虎;多Agent协同的强化学习方法研究[D];国防科学技术大学;2003年
3 宋梅萍;多移动机器人协作任务的分布式决策控制系统[D];哈尔滨工程大学;2003年
4 卢方国;强化学习在个性化信息Agent的应用研究[D];广东工业大学;2004年
5 郭一明;基于强化学习的劣化系统维修策略研究[D];合肥工业大学;2011年
6 钱征;基于强化学习的倒立摆控制研究[D];北京工业大学;2005年
7 王瑞霞;基于强化学习的倒立摆控制[D];北京工业大学;2005年
8 顾鑫;个性化智能信息检索系统研究[D];哈尔滨工程大学;2004年
9 张驰;基于ROBOCUP的多智能体系统设计与实现[D];北京工业大学;2004年
10 袁继彬;大规模Markov系统基于性能势学习的NDP优化方法研究[D];合肥工业大学;2005年
中国重要报纸全文数据库 前10条
1 记者 刘琰;强化学习 增强本领 扎实工作[N];周口日报;2009年
2 谭育才;强化学习 克己奉公[N];赤峰日报;2008年
3 章斌、特约记者夏吉龙;8710部队 破解难题强化学习教育效果[N];人民武警;2010年
4 通讯员 马全有;强化学习 搞好服务 解放思想[N];甘肃法制报;2007年
5 李北川;强化学习 找准问题 着力整改[N];凉山日报(汉);2007年
6 陈滟澎 张玮(作者单位:市交通局公路处);强化学习提高机关办事效能[N];廊坊日报;2006年
7 记者 刘莉 实习记者 刘慕欣;兵团党委“保先”教育活动督导组强化学习[N];兵团日报(汉);2005年
8 记者王旭燕、实习生张娜;强化学习抓好落实 确保完成全年目标任务[N];铜川日报;2009年
9 关真付;唐山市文化局强化学习狠抓落实[N];中国文化报;2003年
10 朱玉亭 孙良景 鞠允国;强化学习重结合认真整改谋发展[N];人民公安报;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978