收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于ASPL模型的多智能体强化学习在RoboCup中的应用

张家旺  韩光胜  张伟  
【摘要】:多智能体系统是分布式人工智能系统的一个特殊类型。在多智能体系统中,动作的重复选择将导致Agent之间的协调性变差,同时传统的强化学习会造成很大的计算消耗。因此,本文以基本的强化学习为基础,应用多智能体强化学习方法,同时引入ASPL模型,从而优化了状态、动作空间。将此方法应用于机器人足球比赛中,在线学习球员之间的动作协调。实验表明了该方法的有效性。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 卞凯;;基于强化学习的城市交通区域协调控制研究[J];电子技术;2011年08期
2 夏丽丽;;连续状态-连续行动强化学习[J];电脑知识与技术;2011年19期
3 何大阔;高广宇;王福利;刘阳;;多智能体差分进化算法[J];控制与决策;2011年07期
4 祝宇虹;毛俊鑫;;基于人工情感与Q学习的机器人行为决策[J];机械与电子;2011年07期
5 刘卫红;周义莲;;强化学习方法在Web服务组合中的应用比较研究[J];计算机应用与软件;2011年07期
6 赵业清;朱道飞;王华;毕贵红;王建军;;基于Petri网和Agent的复杂适应系统建模[J];计算机工程;2011年15期
7 张文柱;邵丽娜;;异构无线网络中基于强化学习的频谱管理算法[J];西安电子科技大学学报;2011年04期
8 李昭阁;;强化学习,更新观念,发挥校园网作用[J];学周刊;2011年12期
9 许培;薛伟;;基于Q-learning的一种多Agent系统结构模型[J];计算机与数字工程;2011年08期
10 曾斌;姚路;陈志诚;;基于负载平衡智能体的分布式Web代理群集研究[J];计算机工程与设计;2011年08期
11 钟建琳;刘忠和;;制造系统中多智能体运输子系统的调度与监控[J];机床与液压;2011年11期
12 沈元;;关于人工智能及其应用的分析探讨[J];信息与电脑(理论版);2011年06期
13 常晓军;;基于联合强化学习的RoboCup-2D传球策略[J];计算机工程与应用;2011年23期
14 冯侦探;尤佳莉;倪宏;;P2P VOD系统邻居节点查找算法[J];计算机工程与应用;2011年24期
15 王世进;;面向制造任务动态分配的改进合同网机制[J];计算机集成制造系统;2011年06期
16 刘一松;李倩倩;;一种最优规划程序设计语言OPPLFC[J];计算机应用研究;2011年08期
17 蔡建羡;阮晓钢;;基于遗传算法的Skinner操作条件反射学习模型[J];系统工程与电子技术;2011年06期
18 左敏;曾广平;涂序彦;魏伟;;基于平行进化的机器人智能控制研究[J];计算机仿真;2011年08期
19 陈煜敏;;移动机器人在障碍空间中路径规划的研究[J];科技信息;2011年15期
20 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 张家旺;韩光胜;张伟;;基于ASPL模型的多智能体强化学习在RoboCup中的应用[A];2005中国机器人大赛论文集[C];2005年
2 张伟;李建更;张家旺;;多智能体强化学习在机器人足球比赛中的应用[A];2005年中国智能自动化会议论文集[C];2005年
3 王晓丽;洪奕光;;利用动态多智能体覆盖跟踪动态目标[A];第五届全国复杂网络学术会议论文(摘要)汇集[C];2009年
4 俞辉;蹇继贵;;多智能体有向切换网络的加权平均一致性[A];第二十七届中国控制会议论文集[C];2008年
5 段志生;;复杂网络同步与多智能体一致性控制的统一方法[A];第四届全国动力学与控制青年学者研讨会论文摘要集[C];2010年
6 初旭新;韩光胜;刘云江;;多智能体足球机器人决策系统的协作控制[A];2005年中国智能自动化会议论文集[C];2005年
7 陈涛;陈森发;姚天行;宋跃武;;智能引导与智能控制的协同[A];第二十九届中国控制会议论文集[C];2010年
8 李真;吴定会;纪志成;;基于模糊CMAC的强化学习在Robocup中的应用[A];2007中国控制与决策学术年会论文集[C];2007年
9 赵育强;孙振东;;多智能体的分散混合控制[A];第二十七届中国控制会议论文集[C];2008年
10 冯志君;周德俭;谌炎辉;袁海英;;基于多智能体的液压系统网络协同设计建模研究[A];2011年机械电子学学术会议论文集[C];2011年
中国博士学位论文全文数据库 前10条
1 苏厚胜;多智能体蜂拥控制问题研究[D];上海交通大学;2008年
2 孙凤兰;多智能体网络的一致性研究[D];华中科技大学;2012年
3 谭拂晓;多智能体网络系统一致平衡点与合作控制研究[D];燕山大学;2010年
4 刘智伟;基于混杂控制的复杂多智能体网络同步一致性研究[D];华中科技大学;2011年
5 李红梅;智能优化方法在电力系统调频中的应用研究[D];上海交通大学;2011年
6 孙永征;多智能体网络的一致性及混沌系统的同步研究[D];复旦大学;2010年
7 金钊;加速强化学习方法研究[D];云南大学;2010年
8 吴永红;复杂动态系统的一致性与耗散性研究[D];华中科技大学;2011年
9 徐明亮;强化学习及其应用研究[D];江南大学;2010年
10 陈学松;强化学习及其在机器人系统中的应用研究[D];广东工业大学;2011年
中国硕士学位论文全文数据库 前10条
1 刘丽杰;基于多智能体的炼厂生产调度优化系统开发[D];中国石油大学;2010年
2 梁铁;基于多智能体的远程健康监护系统结构及时间校准研究[D];河北大学;2011年
3 刘阳;基于多智能体的足球机器人系统决策模型设计[D];中南大学;2004年
4 王东阳;多智能体调度优化算法研究[D];哈尔滨工程大学;2010年
5 杨念;基于多智能体的大规模人群疏散模拟技术研究[D];武汉理工大学;2011年
6 杨波;城市交通诱导与控制系统一体化集成理论与技术研究[D];桂林电子科技大学;2010年
7 邓君令;多智能体协同作业的初步研究[D];广东工业大学;2001年
8 李永平;基于多智能体协同进化的多目标跟踪算法研究[D];中国石油大学;2010年
9 苏艳芳;基于MDP的多智能体交通信号灯控制方法[D];电子科技大学;2010年
10 沈志忠;多智能体及其在生产系统的控制和故障诊断中的应用[D];河北工业大学;2003年
中国重要报纸全文数据库 前10条
1 记者 刘琰;强化学习 增强本领 扎实工作[N];周口日报;2009年
2 谭育才;强化学习 克己奉公[N];赤峰日报;2008年
3 章斌、特约记者夏吉龙;8710部队 破解难题强化学习教育效果[N];人民武警;2010年
4 通讯员 马全有;强化学习 搞好服务 解放思想[N];甘肃法制报;2007年
5 李北川;强化学习 找准问题 着力整改[N];凉山日报(汉);2007年
6 陈滟澎 张玮(作者单位:市交通局公路处);强化学习提高机关办事效能[N];廊坊日报;2006年
7 记者 刘莉 实习记者 刘慕欣;兵团党委“保先”教育活动督导组强化学习[N];兵团日报(汉);2005年
8 记者王旭燕、实习生张娜;强化学习抓好落实 确保完成全年目标任务[N];铜川日报;2009年
9 关真付;唐山市文化局强化学习狠抓落实[N];中国文化报;2003年
10 朱玉亭 孙良景 鞠允国;强化学习重结合认真整改谋发展[N];人民公安报;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978