收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

强化学习在移动机器人导航上的应用

卓睿  陈宗海  陈春林  
【摘要】:导航是移动机器人的一项关键技术。强化学习通过试错与环境交互获得策略的改进,其自学习和在线学习的特点使其成为机器学习领域的—个重要分支。该文首先分析了机器人学习存在的一些同题;其次介绍了强化学习的原理和结构;然后结合近年来的研究综述了强化学习技术在导航应用上的两种方法:离散化法和函数估计法:最后简单的介绍了强化学习在移动机器人导航领域未来的发展方向。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 夏丽丽;;连续状态-连续行动强化学习[J];电脑知识与技术;2011年19期
2 祝宇虹;毛俊鑫;;基于人工情感与Q学习的机器人行为决策[J];机械与电子;2011年07期
3 刘卫红;周义莲;;强化学习方法在Web服务组合中的应用比较研究[J];计算机应用与软件;2011年07期
4 黄付亮;张荣国;陈大川;刘焜;;基于联合博弈的多Agent学习[J];计算机与数字工程;2011年06期
5 冯为嘉;张宝峰;朱均超;曹作良;;嵌入式全方位视觉导航器研究[J];光电子.激光;2011年08期
6 张文柱;邵丽娜;;异构无线网络中基于强化学习的频谱管理算法[J];西安电子科技大学学报;2011年04期
7 李昭阁;;强化学习,更新观念,发挥校园网作用[J];学周刊;2011年12期
8 许培;薛伟;;基于Q-learning的一种多Agent系统结构模型[J];计算机与数字工程;2011年08期
9 常晓军;;基于联合强化学习的RoboCup-2D传球策略[J];计算机工程与应用;2011年23期
10 冯侦探;尤佳莉;倪宏;;P2P VOD系统邻居节点查找算法[J];计算机工程与应用;2011年24期
11 王世进;;面向制造任务动态分配的改进合同网机制[J];计算机集成制造系统;2011年06期
12 刘一松;李倩倩;;一种最优规划程序设计语言OPPLFC[J];计算机应用研究;2011年08期
13 蔡建羡;阮晓钢;;基于遗传算法的Skinner操作条件反射学习模型[J];系统工程与电子技术;2011年06期
14 左敏;曾广平;涂序彦;魏伟;;基于平行进化的机器人智能控制研究[J];计算机仿真;2011年08期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 卓睿;陈宗海;陈春林;;强化学习在移动机器人导航上的应用[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
2 何宁强;;基于多传感器信息融合的移动机器人导航研究[A];中国计量协会冶金分会2010年会论文集[C];2010年
3 韩盛;李书杰;陈宗海;;移动机器人导航的信息融合技术分析与展望[A];第13届中国系统仿真技术及其应用学术年会论文集[C];2011年
4 文锋;陈宗海;陈春林;;基于RLS-TD和值梯度的强化学习方法用于LQR控制问题[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
5 刘海波;董玉杰;王福忠;牛满仓;;基于单目视觉的移动机器人导航算法研究[A];中国自动化学会控制理论专业委员会D卷[C];2011年
6 张伟;李建更;张家旺;;多智能体强化学习在机器人足球比赛中的应用[A];2005年中国智能自动化会议论文集[C];2005年
7 张家旺;韩光胜;张伟;;基于ASPL模型的多智能体强化学习在RoboCup中的应用[A];2005中国机器人大赛论文集[C];2005年
8 敬斌;田野;;Robocup中的传球策略[A];2005中国机器人大赛论文集[C];2005年
9 陈春林;陈宗海;卓睿;;分层式强化学习的定性空间表达[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
10 涂自然;王维;梁以业;禹建丽;;基于强化学习的自适应变步长机器人路径规划算法[A];2003年中国智能自动化会议论文集(上册)[C];2003年
中国博士学位论文全文数据库 前10条
1 金钊;加速强化学习方法研究[D];云南大学;2010年
2 陈春林;基于强化学习的移动机器人自主学习及导航控制[D];中国科学技术大学;2006年
3 徐明亮;强化学习及其应用研究[D];江南大学;2010年
4 陈学松;强化学习及其在机器人系统中的应用研究[D];广东工业大学;2011年
5 仲宇;分布式强化学习理论及在多机器人中的应用研究[D];哈尔滨工程大学;2003年
6 李誌;基于视觉听觉语义相干性的强化学习系统的研究[D];太原理工大学;2012年
7 郭庆;多Agent系统协商中若干关键技术的研究[D];浙江大学;2003年
8 刘娟;基于时空信息与认知模型的移动机器人导航机制研究[D];中南大学;2003年
9 戴朝晖;基于混合抽象机制的多智能体系统动态分层强化学习算法研究[D];中南大学;2012年
10 陈凤东;基于认知地图的移动机器人自主导航技术研究[D];哈尔滨工业大学;2009年
中国硕士学位论文全文数据库 前10条
1 尹晓虎;多Agent协同的强化学习方法研究[D];国防科学技术大学;2003年
2 宋梅萍;多移动机器人协作任务的分布式决策控制系统[D];哈尔滨工程大学;2003年
3 卢方国;强化学习在个性化信息Agent的应用研究[D];广东工业大学;2004年
4 贺振东;基于改进Q-学习的导航知识获取算法研究[D];东北电力大学;2006年
5 郭一明;基于强化学习的劣化系统维修策略研究[D];合肥工业大学;2011年
6 钱征;基于强化学习的倒立摆控制研究[D];北京工业大学;2005年
7 王瑞霞;基于强化学习的倒立摆控制[D];北京工业大学;2005年
8 任建功;基于强化学习的自主式移动机器人导航控制[D];哈尔滨工业大学;2010年
9 顾鑫;个性化智能信息检索系统研究[D];哈尔滨工程大学;2004年
10 张驰;基于ROBOCUP的多智能体系统设计与实现[D];北京工业大学;2004年
中国重要报纸全文数据库 前10条
1 记者 刘琰;强化学习 增强本领 扎实工作[N];周口日报;2009年
2 谭育才;强化学习 克己奉公[N];赤峰日报;2008年
3 章斌、特约记者夏吉龙;8710部队 破解难题强化学习教育效果[N];人民武警;2010年
4 通讯员 马全有;强化学习 搞好服务 解放思想[N];甘肃法制报;2007年
5 李北川;强化学习 找准问题 着力整改[N];凉山日报(汉);2007年
6 陈滟澎 张玮(作者单位:市交通局公路处);强化学习提高机关办事效能[N];廊坊日报;2006年
7 记者 刘莉 实习记者 刘慕欣;兵团党委“保先”教育活动督导组强化学习[N];兵团日报(汉);2005年
8 记者王旭燕、实习生张娜;强化学习抓好落实 确保完成全年目标任务[N];铜川日报;2009年
9 关真付;唐山市文化局强化学习狠抓落实[N];中国文化报;2003年
10 朱玉亭 孙良景 鞠允国;强化学习重结合认真整改谋发展[N];人民公安报;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978