分层式强化学习的定性空间表达
【摘要】:分层式强化学习是解决强化学习问题中大规模学习空间问题的一种重要方法。但分层式强化学习要协调解决不同层次的学习问题,合适的问题表示方法是其关键性技术。本文以移动机器人导航控制为应用背景,在给出了基于拓扑地图的定性空间构造方法的基础上,提出了用基于定性空间推理的混合代数理论结构来描述分层式强化学习的基本框架,给出了相应的定义、定理及证明,并讨论了相关问题。
|
|
|
|
1 |
李春贵,刘永信;一种有限时段Markov决策过程的强化学习算法[J];广西工学院学报;2003年01期 |
2 |
刘菲;曾广周;;基于强化学习的多移动Agent学习算法[J];计算机工程与应用;2006年05期 |
3 |
宋一然;;基于强化学习的多机器人路径规划方法[J];莆田学院学报;2006年02期 |
4 |
何锫;王峰;肖淑苹;;基于异联想记忆Hopfield网络的强化学习[J];微计算机信息;2008年26期 |
5 |
张汝波,顾国昌,刘照德,王醒策;强化学习理论、算法及应用[J];控制理论与应用;2000年05期 |
6 |
李宁,高阳,陆鑫,陈世福;一种基于强化学习的学习Agent[J];计算机研究与发展;2001年09期 |
7 |
张荣,陈卫东;基于强化学习的倒立摆起摆与平衡全过程控制[J];系统工程与电子技术;2004年01期 |
8 |
张化祥;黄上腾;;基于强化学习与对策的多代理协同技术[J];计算机科学;2004年08期 |
9 |
王本年;高阳;陈兆乾;谢俊元;陈世福;;RLGA:一种基于强化学习机制的遗传算法[J];电子学报;2006年05期 |
10 |
邢高峰;;浅谈智能机器人避碰行为的学习方法[J];电脑知识与技术(学术交流);2007年15期 |
11 |
柳毅;高晓光;卢广山;陈红林;;机载多智能体信息融合决策系统[J];火力与指挥控制;2007年09期 |
12 |
王云;韩伟;;一种基于划分和集成思想的多智能体强化学习[J];南京师范大学学报(工程技术版);2008年04期 |
13 |
韩伟;;效用驱动的Markov强化学习[J];计算机工程与应用;2009年04期 |
14 |
徐志洁;;一种处理多类分类问题的强化支持向量机方法[J];计算机工程与应用;2009年26期 |
15 |
陈学松;杨宜民;;强化学习研究综述[J];计算机应用研究;2010年08期 |
16 |
王立春,高阳,陈世福;AODE中基于强化学习的Agent协商模型[J];南京大学学报(自然科学版);2001年02期 |
17 |
郭红霞,吴捷,王春茹;基于强化学习的模型参考自适应控制[J];控制理论与应用;2005年02期 |
18 |
李春贵;多步截断优先扫描强化学习算法[J];计算机工程;2005年11期 |
19 |
钱旭培;;一种基于DFS的Agent在线学习模型研究[J];计算机与现代化;2006年11期 |
20 |
孙方平;符秀辉;;复杂环境下机器人的行为学习研究[J];仪器仪表学报;2006年S3期 |
|