收藏本站
《'2008系统仿真技术及其应用学术会议论文集》2008年
收藏 | 手机打开
二维码
手机客户端打开本文

分层式强化学习研究进展

陈春林  
【摘要】:强化学习是机器学习的一个重要分支,在智能控制中有着广泛应用,具有分层结构的学习算法是克服复杂问题维数灾难、提高学习速度和适应性的关键技术之一。本文综述了分层式强化学习理论及相关算法的研究现状,提出结合定性定量推理的分层结构及各分层之间的有效信息传递与协调是提高分层式强化学习性能的关键技术,并对未来的研究进行了展望.
【作者单位】:南京大学控制与系统工程系
【基金】:国家自然科学基金项目(60703083).
【分类号】:TP18

手机知网App
【参考文献】
中国期刊全文数据库 前9条
1 周殊;潘炜;罗斌;张伟利;丁莹;;一种基于粒子群优化方法的改进量子遗传算法及应用[J];电子学报;2006年05期
2 杨俊安,庄镇泉,史亮;多宇宙并行量子遗传算法[J];电子学报;2004年06期
3 祖丽楠;田彦涛;梅昊;;基于分层强化学习的多移动机器人避障算法[J];吉林大学学报(工学版);2006年S2期
4 沈晶;顾国昌;刘海波;;一种新的分层强化学习方法[J];计算机应用;2006年08期
5 王学宁,徐昕,吴涛,贺汉根;策略梯度强化学习中的最优回报基线[J];计算机学报;2005年06期
6 任燚;陈宗海;;基于强化学习算法的多机器人系统的冲突消解策略[J];控制与决策;2006年04期
7 王凌,吴昊,唐芳,郑大钟,金以慧;混合量子遗传算法及其性能分析[J];控制与决策;2005年02期
8 仲宇,顾国昌,张汝波;多智能体系统中的分布式强化学习研究现状[J];控制理论与应用;2003年03期
9 陈春林;陈宗海;卓睿;周光明;;基于分层式强化学习的移动机器人导航控制[J];南京航空航天大学学报;2006年01期
【共引文献】
中国期刊全文数据库 前10条
1 杨俊安,庄镇泉,庄连生;基于量子遗传算法的多通道通信信号盲反卷积算法研究[J];电路与系统学报;2004年02期
2 梁冰,洪炳镕,曙光;自主机器人视觉与行为模型及避障研究[J];电子学报;2003年S1期
3 杨俊安,庄镇泉,史亮;多宇宙并行量子遗传算法[J];电子学报;2004年06期
4 周殊;潘炜;罗斌;张伟利;丁莹;;一种基于粒子群优化方法的改进量子遗传算法及应用[J];电子学报;2006年05期
5 杨俊安,邹谊,庄镇泉;基于多宇宙并行量子遗传算法的非线性盲源分离算法研究[J];电子与信息学报;2004年08期
6 王长缨;陈文伟;;多agent协同强化学习算法SE-MACOL及其应用[J];广西师范大学学报(自然科学版);2006年04期
7 陆军,徐莉,周小平;强化学习方法在移动机器人导航中的应用[J];哈尔滨工程大学学报;2004年02期
8 张汝波,施洋;基于模糊Q学习的多机器人系统研究[J];哈尔滨工程大学学报;2005年04期
9 宋梅萍,顾国昌,张汝波;移动机器人的自适应式行为融合方法[J];哈尔滨工程大学学报;2005年05期
10 张彦铎,闵锋;基于人工神经网络的强化学习在机器人足球中的应用[J];哈尔滨工业大学学报;2004年07期
中国重要会议论文全文数据库 前10条
1 朴松昊;洪炳熔;褚海涛;;基于BDI的多Agent协作模型研究[A];2003中国控制与决策学术年会论文集[C];2003年
2 刘长有;孙光余;;一种应用Elman型回归网络的Q-学习[A];2004中国控制与决策学术年会论文集[C];2004年
3 邹亮;徐建闽;;基于Q-learning的电子地图动态最短路径求解方法[A];2005中国控制与决策学术年会论文集(下)[C];2005年
4 李鑫;井元伟;;基于强化学习方法的ATM拥塞控制器的设计[A];2007中国控制与决策学术年会论文集[C];2007年
5 谢志华;郑应平;;基于再励学习的排队系统优化控制[A];1995年中国控制会议论文集(下)[C];1995年
6 Bo Fan, Quan Pan (Northwestern Poly-technology University, Xi'an, 710072);Multi-Agent Coordination Based on Distributed Reinforcement Learning and Its Application to Robot Soccer[A];第二十三届中国控制会议论文集(上册)[C];2004年
7 Meng Joo Er;;Modeling and Fuzzy Q-Learning Control of Biped Walking[A];第二十四届中国控制会议论文集(上册)[C];2005年
8 王仲民;岳宏;;基于Q强化学习与CMAC的移动机器人局部路径规划[A];第二十四届中国控制会议论文集(下册)[C];2005年
9 陈宗海;段家庆;任皴;罗杨宇;李成荣;;针对机器人觅食任务的强化学习算法及其仿真研究[A];'2008系统仿真技术及其应用学术会议论文集[C];2008年
10 陈希;侯德文;朱祥玉;;基于强化学习的信息过滤模型[A];山东省计算机学会2005年信息技术与信息化研讨会论文集(二)[C];2005年
中国博士学位论文全文数据库 前10条
1 李威武;城域智能交通系统中的控制与优化问题研究[D];浙江大学;2003年
2 唐振民;智能移动机器人及群体关键技术研究[D];南京理工大学;2002年
3 徐昕;增强学习及其在移动机器人导航与控制中的应用研究[D];国防科学技术大学;2002年
4 王笑蓉;蚁群优化的理论模型及在生产调度中的应用研究[D];浙江大学;2003年
5 郑淑丽;Web信息集成系统及查询优化方法研究[D];合肥工业大学;2003年
6 方远;复合代理体及其在企业管理信息系统中的应用研究[D];东华大学;2001年
7 邹国平;基于智能的高速公路交通控制与管理系统研究[D];长安大学;2002年
8 于江涛;多智能体模型、学习和协作研究与应用[D];浙江大学;2003年
9 仲宇;分布式强化学习理论及在多机器人中的应用研究[D];哈尔滨工程大学;2003年
10 王长缨;多agent协作团队的学习方法研究[D];国防科学技术大学;2004年
中国硕士学位论文全文数据库 前10条
1 魏天滨;一种足球机器人多智能体对抗系统的分层变学习率增强式学习方法[D];中国海洋大学;2004年
2 王醒策;基于强化学习的多机器人编队方法研究[D];哈尔滨工程大学;2002年
3 赵秀粉;蓝牙技术及多代理技术在车间控制系统中的应用研究[D];重庆大学;2003年
4 宋梅萍;多移动机器人协作任务的分布式决策控制系统[D];哈尔滨工程大学;2003年
5 邹丹;自主式水下机器人运动规划技术[D];哈尔滨工程大学;2003年
6 方宝富;MAS结构和协作机制研究及其在Robocup中的应用[D];合肥工业大学;2003年
7 李学勇;基于巩固学习的网络蜘蛛搜索策略研究[D];湖南大学;2003年
8 曾映兰;基于What-This/That学习机制的MAS协商模型[D];湘潭大学;2003年
9 陈雪江;基于强化学习的多机器人协作机制研究[D];浙江工业大学;2004年
10 郭方铭;基于增强学习算法的智能排课模型[D];武汉理工大学;2004年
【二级参考文献】
中国期刊全文数据库 前10条
1 王先培,熊平,李文武;防火墙和入侵检测系统在电力企业信息网络中的应用[J];电力系统自动化;2002年05期
2 王先培,许靓,李峰,吴俊;一种3层结构带自保护的电力信息网络容入侵系统[J];电力系统自动化;2005年10期
3 王宁波,王先培;容侵技术在电力系统数据网络安全中的应用[J];电力自动化设备;2004年10期
4 韩祯祥,曹一家;电力系统的安全性及防治措施[J];电网技术;2004年09期
5 戚宇林,刘文颖,杨以涵,及洪泉;电力信息的网络化传输是电力系统安全的重要保证[J];电网技术;2004年09期
6 胡炎,谢小荣,韩英铎,辛耀中;电力信息系统安全体系设计方法综述[J];电网技术;2005年01期
7 杨俊安,庄镇泉,史亮;多宇宙并行量子遗传算法[J];电子学报;2004年06期
8 宋梅萍,顾国昌,张汝波;移动机器人的自适应式行为融合方法[J];哈尔滨工程大学学报;2005年05期
9 张纯刚,席裕庚;全局环境未知时基于滚动窗口的机器人路径规划[J];中国科学E辑;2001年01期
10 高阳,周志华,何佳洲,陈世福;基于Markov对策的多Agent强化学习模型及算法研究[J];计算机研究与发展;2000年03期
【相似文献】
中国期刊全文数据库 前10条
1 霍士武;徐继勇;王玲娟;;网络制造及其关键技术分析[J];机械设计与制造;2006年01期
2 刘锋;陈文凯;;3自由度并联机器人的研究现状和应用前景[J];企业技术开发;2006年01期
3 陈雪飞;王锦贵;;20世纪90年代以来我国版权贸易研究述评[J];河南师范大学学报(哲学社会科学版);2006年03期
4 雷静桃;高峰;崔莹;;多足步行机器人的研究现状及展望[J];机械设计;2006年09期
5 梁丰;何国金;刘俊英;殷小清;;开放式数控系统的研究现状及趋势[J];装备制造技术;2006年04期
6 吴进琼;梁机;;从文献计量分析看我国梭梭的研究现状[J];农业图书情报学刊;2007年01期
7 李丛伟;;电子商务管理研究综述[J];图书情报工作;2007年02期
8 张爱民;苏百兖;;综论我国信息技术与课程整合的研究与实践[J];武汉职业技术学院学报;2007年02期
9 谢凤萍;杨东俊;;情报学研究现状、未来发展途径及前景[J];巢湖学院学报;2007年04期
10 刘俊英;梁丰;;数控系统的研究现状及发展前景[J];科技信息(学术研究);2007年21期
中国重要会议论文全文数据库 前10条
1 侯有明;陈艺欣;张翔;孙印兵;陈军;章霜红;;福建入侵红火蚁的研究现状及控制技术[A];第三届全国生物入侵大会论文摘要集——“全球变化与生物入侵”[C];2010年
2 刘春雨;涂福泉;许仁波;;磁控形状记忆合金的研究现状及其应用进展[A];2011中国功能材料科技与产业高层论坛论文集(第二卷)[C];2011年
3 苗园青;张学民;申旭辉;;地震舒曼谐振异常的研究现状[A];2011中国地震学会地震电磁学专业委员会换届暨学术研讨会摘要集[C];2011年
4 王昌梅;马煜;张无敌;尹芳;徐锐;李建昌;陈玉保;刘士清;;沼肥的综合利用方式研究现状[A];2011年中国沼气学会学术年会暨第八届理事会第二次会议论文集[C];2011年
5 徐化祥;陈林;刘杰;梁凤兰;陈浩;;云存储:系统实例与研究现状[A];2011年亚太青年通信学术会议论文集(2)[C];2011年
6 王莹莹;杨金生;;中国刮痧规范研究现状及展望[A];2011中国针灸学会年会论文集(摘要)[C];2011年
7 陈连江;王贵强;陈丽;;我国生物质能源研究现状及发展前景[A];首届国际生物经济高层论坛摘要集[C];2005年
8 汪金林;仪淑敏;励建荣;;志贺氏菌的研究现状[A];中国食品科学技术学会第八届年会暨第六届东西方食品业高层论坛论文摘要集[C];2011年
9 支全全;;故障趋势分析技术现状及在深空探测中的应用[A];中国宇航学会深空探测技术专业委员会第七届学术年会论文集[C];2010年
10 尚二莹;彭德良;段玉玺;;烟草根结线虫研究现状和展望[A];中国植物病理学会第六届青年学术研讨会论文集——植物病理学研究进展(第五卷)[C];2003年
中国重要报纸全文数据库 前10条
1 卢钟锋;从历史研究现状看加强马克思主义指导的必要性和紧迫性[N];光明日报;2005年
2 国防科技大学 全方;国外无人驾驶车辆研究现状[N];解放军报;2000年
3 ;我国纳米技术研究现状[N];中国电子报;2002年
4 中国中元国际工程公司 张楠;人力资源管理外包理论及其研究现状[N];中国有色金属报;2011年
5 周宗仪;中药开发研究现状[N];中国医药报;2000年
6 周宗仪;中药开发研究现状[N];中国医药报;2000年
7 西亚非所 贺文萍;俄罗斯的西亚非洲研究现状[N];中国社会科学院院报;2003年
8 总后勤部军需装备研究所 郝新敏;国际医用防护服装的研究现状[N];中国纺织报;2003年
9 程书权;鼻腔给药的研究现状[N];中国医药报;2002年
10 主持人 薛文东 李林 赵勇 博士;为炼钢生产助力[N];中国冶金报;2007年
中国博士学位论文全文数据库 前10条
1 郭茂全;新时期西部散文研究[D];兰州大学;2011年
2 单初;基于交易环境的消费者信任转移研究[D];华中科技大学;2010年
3 龙洋;我国教育法学理论体系研究[D];西南大学;2011年
4 钱晓岚;复杂系统中的演化和动力学过程[D];北京邮电大学;2010年
5 谢林柏;网络化控制系统中若干问题的研究[D];华中科技大学;2004年
6 张瑞雪;B2C网络商店的绑定导向研究[D];大连理工大学;2010年
7 陈阳;需求不确定下的供应链精柔协同优化研究[D];西南交通大学;2010年
8 席莉莉;计算机辅助药物和蛋白性质预测研究[D];兰州大学;2010年
9 刘琰;消费者鼠碑期望及其满意研究[D];大连理工大学;2010年
10 陈海珠;膜计算应用研究[D];重庆大学;2011年
中国硕士学位论文全文数据库 前10条
1 刘璞;我国“体育营销”研究的现状与发展建议[D];华中师范大学;2006年
2 饶玉梅;我国学科德育研究现状及问题研究[D];西南大学;2008年
3 周秀英;合作学习下个体责任感建立的研究[D];南京师范大学;2008年
4 张承坤;浅析我国科学技术哲学的研究现状[D];复旦大学;2009年
5 王秀清;十五年(1985-2000)阮籍研究述评[D];内蒙古大学;2008年
6 黄迪;物联网的应用和发展研究[D];北京邮电大学;2011年
7 王志飞;中国银行内部控制问题研究[D];西南交通大学;2007年
8 王博雅;李开先戏曲创作研究[D];兰州大学;2008年
9 李杰;蒋捷及其词作论稿[D];吉林大学;2008年
10 张春辉;本体进展及中西医人体经脉本体构建研究[D];中国人民解放军军事医学科学院;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026