收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

多智能体强化学习在机器人足球比赛中的应用

张伟  李建更  张家旺  
【摘要】:多智能体系统是分布式人工智能系统的一个特殊类型.以基本的强化学习为基础,提出特殊状态下多智能体强化学习方法,把比赛场地划分不同的区域,依据球所在区域进行不同的动作选择,从而减少状态动作空间.将此方法应用于机器人足球比赛中,在线学习队员之间的动作协调.实验表明了该方法的有效性.

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 朱亚东;杜晋;王芹;;多智能体的鲁棒自适应有向三角编队控制[J];扬州职业大学学报;2011年02期
2 佘莹莹;方华京;;基于一类连续非线性函数的多智能体系统有限时间一致性[J];控制与决策;2011年07期
3 ;编者的话[J];计算机仿真;2011年07期
4 佘莹莹;方华京;;多智能体系统的有限时间跟踪控制[J];系统工程与电子技术;2011年08期
5 宋述宏;;基于MAS-SOA的微网群广域协同控制[J];电工技术;2011年07期
6 孙凤兰;关治洪;;具有变通信时延的多智能体系统的平均一致性[J];华中科技大学学报(自然科学版);2011年07期
7 金达开;;多智能体系统跟踪领导节点的随机一致性问题研究[J];微型电脑应用;2011年06期
8 常晓军;;基于联合强化学习的RoboCup-2D传球策略[J];计算机工程与应用;2011年23期
9 王雪茹;袁建清;崔然;;多智能体技术及其在交通控制系统中的应用[J];中国新技术新产品;2011年17期
10 李少斌;杨忠;陈喆;杨成顺;黄宵宁;;一种基于邻域感知的群集控制算法[J];应用科技;2011年07期
11 熊坤鹏;卢俊国;;具有动态领导节点的多智能体系统一致性分析[J];微型电脑应用;2011年06期
12 谢国琪;彭军;张晓勇;;结合带权与或树和AOE-网的任务规划研究[J];计算机工程与应用;2011年19期
13 吴怀宇;郑秀娟;程磊;张玉礼;;多机器人编队的仿真实验教学研究[J];电气电子教学学报;2011年03期
14 宋大雷;葛磊华;魏爱敏;李艳丽;;基于远方优先的机器人足球角色分配策略的研究[J];计算机应用与软件;2011年07期
15 陈小平;罗文坚;;以机器人实验为载体的实践创新培养体系研究[J];研究生教育研究;2011年03期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 黄鸿;任雪梅;宋祎斐;;一种基于专家系统的分层策略——在FIRA多智能体协作中的实现[A];马斯特杯2003年中国机器人大赛及研讨会论文集[C];2003年
2 王行甫;庄严;陈小平;;机器人足球与大学计算机教育的初步思考[A];全国第十五届计算机科学与技术应用学术会议论文集[C];2003年
3 孙铁利;杨永明;赵晶晶;;营救智能体的研究与开发[A];2005年全国理论计算机科学学术年会论文集[C];2005年
4 张伟;李建更;张家旺;;多智能体强化学习在机器人足球比赛中的应用[A];2005年中国智能自动化会议论文集[C];2005年
5 白文峰;;足球机器人系统运动学模型研究[A];马斯特杯2003年中国机器人大赛及研讨会论文集[C];2003年
6 张文广;郭振凯;;一类高阶多智能体系统的一致控制研究[A];中国自动化学会控制理论专业委员会C卷[C];2011年
7 杨熙;王金枝;;多智能体系统一致性的鲁棒性分析[A];第五届全国复杂网络学术会议论文(摘要)汇集[C];2009年
8 张亚;田玉平;;离散时间多智能体系统一致的权重条件[A];中国自动化学会控制理论专业委员会B卷[C];2011年
9 杨熙;王金枝;;Leader-Follower结构下多智能体系统一致性的鲁棒性能分析[A];第二十九届中国控制会议论文集[C];2010年
10 薛栋;姚静;余有灵;胡俊杰;;具有切换拓扑和非线性环节的关联多智能体系统一致性分析[A];第五届全国复杂网络学术会议论文(摘要)汇集[C];2009年
中国博士学位论文全文数据库 前10条
1 佘莹莹;多智能体系统一致性若干问题的研究[D];华中科技大学;2010年
2 彭科;带领导者的多智能体系统中的一致性问题研究[D];上海交通大学;2009年
3 吴锋;基于决策理论的多智能体系统规划问题研究[D];中国科学技术大学;2011年
4 王强;机器人足球决策系统研究与实现[D];四川大学;2005年
5 唐平;多智能体系统冲突消解与智能机器人动态路径规划研究[D];广东工业大学;2002年
6 钟碧良;机器人足球系统的研究与实现[D];广东工业大学;2003年
7 钟伟才;多智能体进化模型和算法研究[D];西安电子科技大学;2004年
8 骆翔宇;多智能体系统的符号模型检测[D];中山大学;2006年
9 袁侃;复杂系统的故障诊断及容错控制研究[D];南京航空航天大学;2010年
10 彭军;多智能体系统协作模型及其在足球机器人仿真系统中的应用[D];中南大学;2005年
中国硕士学位论文全文数据库 前10条
1 朱莹莹;基于Multi-Agent仿真机器人足球比赛策略研究与开发[D];华北电力大学(北京);2006年
2 郭华;分布式足球机器人学习与协作研究[D];西北工业大学;2006年
3 瓮松峰;微型足球机器人防守策略研究[D];天津大学;2005年
4 杨涛;基于多智能体的移动机器人控制与协作研究[D];华中科技大学;2005年
5 曹成才;机器人足球仿真系统的研究[D];四川大学;2005年
6 尚旭辉;TSR-1足球机器人底层控制系统及通讯子系统的研究[D];天津大学;2004年
7 郭叶军;机器人足球仿真比赛中多智能体系统的构建[D];浙江大学;2004年
8 邱宇航;协作协进化算法应用于多智能体协作的研究[D];浙江工业大学;2005年
9 张晓勇;RoboCup中多智能体系统协作的研究与实现[D];中南大学;2005年
10 秦志斌;自主移动机器人高可靠性软件体系结构研究[D];浙江大学;2006年
中国重要报纸全文数据库 前8条
1 东北大学人工智能与机器人研究所所长 徐心和;机器人足球[N];科技日报;2001年
2 洪炳熔;“绿茵场”掀起机器人大战[N];大众科技报;2000年
3 记者 吴长锋;中科大机器人“可佳”能思考会推理[N];科技日报;2009年
4 记者罗冰;我智能机器人足球研究屡获佳绩[N];科技日报;2002年
5 本报记者 张蕾;机器人足球赛:绿茵场人工智能大战[N];光明日报;2003年
6 记者邰举;FI RA机器人足球世界杯赛闭幕[N];科技日报;2002年
7 本报记者 缪琴;成都娃包揽VEX机器人挑战赛三金[N];成都日报;2010年
8 记者 桂运安;“机器人世界杯”科大摘金夺银[N];安徽日报;2011年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978