收藏本站
《’2004系统仿真技术及其应用学术交流会论文集》2004年
收藏 | 手机打开
二维码
手机客户端打开本文

分层式强化学习的定性空间表达

陈春林  陈宗海  卓睿  
【摘要】:分层式强化学习是解决强化学习问题中大规模学习空间问题的一种重要方法。但分层式强化学习要协调解决不同层次的学习问题,合适的问题表示方法是其关键性技术。本文以移动机器人导航控制为应用背景,在给出了基于拓扑地图的定性空间构造方法的基础上,提出了用基于定性空间推理的混合代数理论结构来描述分层式强化学习的基本框架,给出了相应的定义、定理及证明,并讨论了相关问题。

手机知网App
【共引文献】
中国期刊全文数据库 前10条
1 李春贵,吴沧浦,刘永信;一种集成规划的SARSA(λ)强化学习算法[J];北京理工大学学报;2002年03期
2 林海,孙吉贵;预测及其主要模型的实现系统[J];吉林大学学报(信息科学版);2002年04期
3 吕志来,张保会,哈恒旭;一种变结构的时间序列预测算法及其在电力系统暂态稳定预测中的应用[J];电工技术学报;2002年03期
4 秦斌 ,王欣 ,吴敏;基于RBF神经网络的铁水硅含量预报模型[J];电气传动;2002年03期
5 梁冰,洪炳镕,曙光;自主机器人视觉与行为模型及避障研究[J];电子学报;2003年S1期
6 陆军,徐莉,周小平;强化学习方法在移动机器人导航中的应用[J];哈尔滨工程大学学报;2004年02期
7 宋梅萍,顾国昌,张汝波;移动机器人的自适应式行为融合方法[J];哈尔滨工程大学学报;2005年05期
8 张彦铎,闵锋;基于人工神经网络的强化学习在机器人足球中的应用[J];哈尔滨工业大学学报;2004年07期
9 郭茂祖,王亚东,刘 扬,孙华梅;基于Metropolis准则的Q-学习算法研究[J];计算机研究与发展;2002年06期
10 殷苌茗,陈焕文,谢丽娟;样本有限关联值递归Q学习算法及其收敛性证明[J];计算机研究与发展;2002年09期
中国重要会议论文全文数据库 前10条
1 胡光华;;平均准则TD策略迭代算法[A];中国运筹学会第六届学术交流会论文集(上卷)[C];2000年
2 胡光华;殷英;李世云;;即时差分策略迭代算法[A];中国运筹学会第七届学术交流会论文集(下卷)[C];2004年
3 王直杰;方建安;邵世煌;;一种增强式学习算法及其在控制中的应用[A];1996中国控制与决策学术年会论文集[C];1996年
4 朴松昊;洪炳熔;褚海涛;;基于BDI的多Agent协作模型研究[A];2003中国控制与决策学术年会论文集[C];2003年
5 刘长有;孙光余;;一种应用Elman型回归网络的Q-学习[A];2004中国控制与决策学术年会论文集[C];2004年
6 邹亮;徐建闽;;基于Q-learning的电子地图动态最短路径求解方法[A];2005中国控制与决策学术年会论文集(下)[C];2005年
7 谢志华;郑应平;;基于再励学习的排队系统优化控制[A];1995年中国控制会议论文集(下)[C];1995年
8 Meng Joo Er;;Modeling and Fuzzy Q-Learning Control of Biped Walking[A];第二十四届中国控制会议论文集(上册)[C];2005年
9 王仲民;岳宏;;基于Q强化学习与CMAC的移动机器人局部路径规划[A];第二十四届中国控制会议论文集(下册)[C];2005年
10 陈春林;;分层式强化学习研究进展[A];'2008系统仿真技术及其应用学术会议论文集[C];2008年
中国博士学位论文全文数据库 前10条
1 张涛;非线性系统控制策略的研究[D];浙江大学;2001年
2 徐昕;增强学习及其在移动机器人导航与控制中的应用研究[D];国防科学技术大学;2002年
3 佘震宇;复杂经济系统演化建模研究[D];天津大学;2003年
4 郑淑丽;Web信息集成系统及查询优化方法研究[D];合肥工业大学;2003年
5 李四明;基于智能Agent的网上农业信息挖掘研究[D];中国农业大学;2003年
6 方远;复合代理体及其在企业管理信息系统中的应用研究[D];东华大学;2001年
7 邹国平;基于智能的高速公路交通控制与管理系统研究[D];长安大学;2002年
8 李威武;城域智能交通系统中的控制与优化问题研究[D];浙江大学;2003年
9 于江涛;多智能体模型、学习和协作研究与应用[D];浙江大学;2003年
10 赵黎明;灾害管理系统研究[D];天津大学;2003年
中国硕士学位论文全文数据库 前10条
1 敖炎;基于定性推理的机构辅助概念设计研究[D];西安电子科技大学;2002年
2 王醒策;基于强化学习的多机器人编队方法研究[D];哈尔滨工程大学;2002年
3 张必勇;强化学习在用户学习中的应用研究[D];太原理工大学;2003年
4 赵秀粉;蓝牙技术及多代理技术在车间控制系统中的应用研究[D];重庆大学;2003年
5 宋梅萍;多移动机器人协作任务的分布式决策控制系统[D];哈尔滨工程大学;2003年
6 邹丹;自主式水下机器人运动规划技术[D];哈尔滨工程大学;2003年
7 罗宁泉;增强学习在共面双机空战格斗中的应用[D];沈阳工业大学;2003年
8 滕轶栋;移动通信系统信道分配算法研究[D];浙江工业大学;2004年
9 李学勇;基于巩固学习的网络蜘蛛搜索策略研究[D];湖南大学;2003年
10 陈雪江;基于强化学习的多机器人协作机制研究[D];浙江工业大学;2004年
【相似文献】
中国期刊全文数据库 前10条
1 李春贵,刘永信;一种有限时段Markov决策过程的强化学习算法[J];广西工学院学报;2003年01期
2 刘菲;曾广周;;基于强化学习的多移动Agent学习算法[J];计算机工程与应用;2006年05期
3 宋一然;;基于强化学习的多机器人路径规划方法[J];莆田学院学报;2006年02期
4 何锫;王峰;肖淑苹;;基于异联想记忆Hopfield网络的强化学习[J];微计算机信息;2008年26期
5 张汝波,顾国昌,刘照德,王醒策;强化学习理论、算法及应用[J];控制理论与应用;2000年05期
6 李宁,高阳,陆鑫,陈世福;一种基于强化学习的学习Agent[J];计算机研究与发展;2001年09期
7 张荣,陈卫东;基于强化学习的倒立摆起摆与平衡全过程控制[J];系统工程与电子技术;2004年01期
8 张化祥;黄上腾;;基于强化学习与对策的多代理协同技术[J];计算机科学;2004年08期
9 王本年;高阳;陈兆乾;谢俊元;陈世福;;RLGA:一种基于强化学习机制的遗传算法[J];电子学报;2006年05期
10 邢高峰;;浅谈智能机器人避碰行为的学习方法[J];电脑知识与技术(学术交流);2007年15期
中国重要会议论文全文数据库 前10条
1 陈春林;陈宗海;卓睿;;分层式强化学习的定性空间表达[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
2 文锋;陈宗海;陈春林;;基于RLS-TD和值梯度的强化学习方法用于LQR控制问题[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
3 卓睿;陈宗海;陈春林;;强化学习在移动机器人导航上的应用[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
4 张伟;李建更;张家旺;;多智能体强化学习在机器人足球比赛中的应用[A];2005年中国智能自动化会议论文集[C];2005年
5 张家旺;韩光胜;张伟;;基于ASPL模型的多智能体强化学习在RoboCup中的应用[A];2005中国机器人大赛论文集[C];2005年
6 敬斌;田野;;Robocup中的传球策略[A];2005中国机器人大赛论文集[C];2005年
7 涂自然;王维;梁以业;禹建丽;;基于强化学习的自适应变步长机器人路径规划算法[A];2003年中国智能自动化会议论文集(上册)[C];2003年
8 叶道年;陈卫东;;机器人团队协作的强化学习[A];2004中国机器人足球比赛暨学术研讨会论文集[C];2004年
9 方宝富;王浩;姚宏亮;杨静;周晋;;Q学习在机器人足球中的应用[A];2004中国机器人足球比赛暨学术研讨会论文集[C];2004年
10 潘凌寒;程显毅;;RoboCup仿真比赛中机器学习问题的研究[A];2004中国机器人足球比赛暨学术研讨会论文集[C];2004年
中国重要报纸全文数据库 前10条
1 孙佳宇;强化学习教育 增强服务意识[N];人民公安报;2009年
2 首席记者 朱丽华;强化学习 落实责任 确保取得实效[N];盘锦日报;2009年
3 王良豪 记者 刘伟 龙先华;通过创新工作取得活动效果[N];六盘水日报;2008年
4 书分;解放区审计局强化学习抓作风[N];焦作日报;2006年
5 记者 刘琰;强化学习 增强本领 扎实工作[N];周口日报;2009年
6 谭育才;强化学习 克己奉公[N];赤峰日报;2008年
7 章斌、特约记者夏吉龙;8710部队 破解难题强化学习教育效果[N];人民武警;2010年
8 张峰;SAN进入分层式体系结构[N];网络世界;2005年
9 通讯员 马全有;强化学习 搞好服务 解放思想[N];甘肃法制报;2007年
10 李北川;强化学习 找准问题 着力整改[N];凉山日报(汉);2007年
中国博士学位论文全文数据库 前10条
1 金钊;加速强化学习方法研究[D];云南大学;2010年
2 徐明亮;强化学习及其应用研究[D];江南大学;2010年
3 陈学松;强化学习及其在机器人系统中的应用研究[D];广东工业大学;2011年
4 朱美强;基于谱图理论的强化学习研究[D];中国矿业大学;2012年
5 陈春林;基于强化学习的移动机器人自主学习及导航控制[D];中国科学技术大学;2006年
6 仲宇;分布式强化学习理论及在多机器人中的应用研究[D];哈尔滨工程大学;2003年
7 李誌;基于视觉听觉语义相干性的强化学习系统的研究[D];太原理工大学;2012年
8 郭庆;多Agent系统协商中若干关键技术的研究[D];浙江大学;2003年
9 戴朝晖;基于混合抽象机制的多智能体系统动态分层强化学习算法研究[D];中南大学;2012年
10 杨东勇;多机器人协作的学习与进化方法[D];浙江大学;2005年
中国硕士学位论文全文数据库 前10条
1 尹晓虎;多Agent协同的强化学习方法研究[D];国防科学技术大学;2003年
2 宋梅萍;多移动机器人协作任务的分布式决策控制系统[D];哈尔滨工程大学;2003年
3 卢方国;强化学习在个性化信息Agent的应用研究[D];广东工业大学;2004年
4 郭一明;基于强化学习的劣化系统维修策略研究[D];合肥工业大学;2011年
5 钱征;基于强化学习的倒立摆控制研究[D];北京工业大学;2005年
6 王瑞霞;基于强化学习的倒立摆控制[D];北京工业大学;2005年
7 顾鑫;个性化智能信息检索系统研究[D];哈尔滨工程大学;2004年
8 张驰;基于ROBOCUP的多智能体系统设计与实现[D];北京工业大学;2004年
9 袁继彬;大规模Markov系统基于性能势学习的NDP优化方法研究[D];合肥工业大学;2005年
10 汪向利;基于多Agent的生产计划与调度系统研究与开发[D];浙江工业大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026