收藏本站
《第二十六届中国控制会议论文集》2007年
收藏 | 手机打开
二维码
手机客户端打开本文

Reinforcement Strategy Using Quantum Amplitude Amplification for Robot Learning

【摘要】:Quantum amplitude amplification is a kind of useful technique in quantum computation and it can boost the success probability of some quantum algorithms.Reinforcement strategy in reinforcement learning is essentially to boost the selection probability of "good" action.Considering the common characteristics,this paper uses the idea of amplitude amplification to reinforcement learning as a new reinforcement strategy,proposes a learning algorithm based on quantum amplitude amplification and demonstrates its effectiveness through simulated experiments.

手机知网App
【共引文献】
中国期刊全文数据库 前10条
1 李春贵,吴沧浦,刘永信;一种集成规划的SARSA(λ)强化学习算法[J];北京理工大学学报;2002年03期
2 林海,孙吉贵;预测及其主要模型的实现系统[J];吉林大学学报(信息科学版);2002年04期
3 吕志来,张保会,哈恒旭;一种变结构的时间序列预测算法及其在电力系统暂态稳定预测中的应用[J];电工技术学报;2002年03期
4 秦斌 ,王欣 ,吴敏;基于RBF神经网络的铁水硅含量预报模型[J];电气传动;2002年03期
5 梁冰,洪炳镕,曙光;自主机器人视觉与行为模型及避障研究[J];电子学报;2003年S1期
6 张汝波,施洋;基于模糊Q学习的多机器人系统研究[J];哈尔滨工程大学学报;2005年04期
7 殷苌茗,陈焕文,谢丽娟;样本有限关联值递归Q学习算法及其收敛性证明[J];计算机研究与发展;2002年09期
8 祖丽楠;田彦涛;梅昊;;基于分层强化学习的多移动机器人避障算法[J];吉林大学学报(工学版);2006年S2期
9 顾国昌,仲宇,张汝波;一种新的多智能体强化学习算法及其在多机器人协作任务中的应用[J];机器人;2003年04期
10 殷苌茗,陈焕文,谢丽娟;基于有限样本的最优费用关联值递归Q学习算法[J];计算机工程与应用;2002年11期
中国重要会议论文全文数据库 前10条
1 胡光华;;平均准则TD策略迭代算法[A];中国运筹学会第六届学术交流会论文集(上卷)[C];2000年
2 胡光华;殷英;李世云;;即时差分策略迭代算法[A];中国运筹学会第七届学术交流会论文集(下卷)[C];2004年
3 王直杰;方建安;邵世煌;;一种增强式学习算法及其在控制中的应用[A];1996中国控制与决策学术年会论文集[C];1996年
4 Bo Fan, Quan Pan (Northwestern Poly-technology University, Xi'an, 710072);Multi-Agent Coordination Based on Distributed Reinforcement Learning and Its Application to Robot Soccer[A];第二十三届中国控制会议论文集(上册)[C];2004年
5 陈春林;陈宗海;卓睿;;分层式强化学习的定性空间表达[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
6 徐义春;韩芳;;结合TD(0)的马尔可夫链扰动分析求解算法[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
7 任燚;陈宗海;;一种强化学习算法应用于多移动机器人的觅食实例研究[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
8 Chichun Lo~1, Weili Lin~2, Jay Wu~3 ~1 Professor, Institute of Information Management, National Chiao-Tung University, Hsin-Chu, 300, Taiwan, China, ~2 PhD Student, Institute of Information Management, National Chiao-Tung University, Hsin-Chu, 300, Taiwan, China, weililin. ~3 Associate Engineer, Institute for Information Industry, Taipei, 106, Taiwan, China,;An XCS-Based Intelligent Searching Model for Cross-Organization Identity Management in Web Service[A];第四届电子商务国际会议论文集(Ⅰ)[C];2004年
9 Kao-Shing Hwang;Jeng-Yih Chiou;;Adaptive Linearization Control Based on Reinforcement Learning[A];2002 IEEE Region 10 Conference on Computers, Communications, Control and Power Engineering Proceedings[C];2002年
10 Shengmei Zhao, JianHua Huang Baoyu Zheng Institute of Signal and Information Processing, Nanjing University of Posts & Telecommunications, Nanjing 210003, China;Recognition of Noisy English Letter by Quantum Back Propagation Network[A];第八届国际信号处理国际会议论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 张涛;非线性系统控制策略的研究[D];浙江大学;2001年
2 徐昕;增强学习及其在移动机器人导航与控制中的应用研究[D];国防科学技术大学;2002年
3 佘震宇;复杂经济系统演化建模研究[D];天津大学;2003年
4 王笑蓉;蚁群优化的理论模型及在生产调度中的应用研究[D];浙江大学;2003年
5 李四明;基于智能Agent的网上农业信息挖掘研究[D];中国农业大学;2003年
6 赵黎明;灾害管理系统研究[D];天津大学;2003年
7 仲宇;分布式强化学习理论及在多机器人中的应用研究[D];哈尔滨工程大学;2003年
8 张双民;群体Agent合作求解方法的研究[D];清华大学;2004年
9 杨东勇;多机器人协作的学习与进化方法[D];浙江大学;2005年
10 王醒策;基于强化学习和群集智能方法的多机器人协作协调研究[D];哈尔滨工程大学;2005年
中国硕士学位论文全文数据库 前10条
1 王醒策;基于强化学习的多机器人编队方法研究[D];哈尔滨工程大学;2002年
2 张必勇;强化学习在用户学习中的应用研究[D];太原理工大学;2003年
3 赵秀粉;蓝牙技术及多代理技术在车间控制系统中的应用研究[D];重庆大学;2003年
4 宋梅萍;多移动机器人协作任务的分布式决策控制系统[D];哈尔滨工程大学;2003年
5 邹丹;自主式水下机器人运动规划技术[D];哈尔滨工程大学;2003年
6 罗宁泉;增强学习在共面双机空战格斗中的应用[D];沈阳工业大学;2003年
7 滕轶栋;移动通信系统信道分配算法研究[D];浙江工业大学;2004年
8 曾映兰;基于What-This/That学习机制的MAS协商模型[D];湘潭大学;2003年
9 陈雪江;基于强化学习的多机器人协作机制研究[D];浙江工业大学;2004年
10 孙光余;强化学习及其在空中拦截中的应用[D];沈阳工业大学;2004年
【相似文献】
中国重要会议论文全文数据库 前10条
1 ;Deterministic Learning from NN Output Feedback Control of Brunovsky Systems[A];中国自动化学会控制理论专业委员会D卷[C];2011年
2 ;Reinforcement Strategy Using Quantum Amplitude Amplification for Robot Learning[A];第二十六届中国控制会议论文集[C];2007年
3 吴峰;;企业数字化学习的十个研究主题(英文)[A];北京论坛(2011)文明的和谐与共同繁荣--传统与现代、变革与转型:“教育传承与创新”教育分论坛论文及摘要集[C];2011年
4 ;Organizational learning,environmental uncertainty,and temporal capabilities[A];第六届(2011)中国管理学年会论文摘要集[C];2011年
5 ;Multi-model Self-learning Control for Turbine Valving Control[A];第二十六届中国控制会议论文集[C];2007年
6 ;Convergence Analysis in the Sense of Lebesgue-p Norm for Open-Closed-Loop Iterative Learning Control[A];第二十六届中国控制会议论文集[C];2007年
7 ;Persistency of Excitation and Performance of Deterministic Learning[A];中国自动化学会控制理论专业委员会D卷[C];2011年
8 Harrison Hao Yang;;新世界,新学习:E-Learning的趋势和议题(英文)[A];北京论坛(2010)文明的和谐与共同繁荣——为了我们共同的家园:责任与行动:“变革时代的教育改革与教育研究:责任与未来”教育分论坛论文或摘要集[C];2010年
9 Tim Unwin;;大学的本质:在数字化世界学习的挑战(英文)[A];北京论坛(2011)文明的和谐与共同繁荣--传统与现代、变革与转型:“教育传承与创新”教育分论坛论文及摘要集[C];2011年
10 吕赐杰;;课堂教学实践的持续变革:教育研究者作为Meso层面行动者的角色(英文)[A];北京论坛(2011)文明的和谐与共同繁荣--传统与现代、变革与转型:“教育传承与创新”教育分论坛论文及摘要集[C];2011年
中国重要报纸全文数据库 前10条
1 本报记者 解艳华;E—learning:期待领军企业的出现[N];人民政协报;2010年
2 本报记者 解艳华;E_learning,新技术带来的“学习革命”[N];人民政协报;2011年
3 郭彦;E——Learning:引发教育领域新革命[N];中国高新技术产业导报;2000年
4 ;E-Learning:引发教育领域新革命[N];科技日报;2000年
5 文才;教育领域新革命[N];市场报;2000年
6 本报记者 王继晟;E-Learning———助推企业培训革命[N];市场报;2002年
7 本报记者 武汉;给e-Learning优先级[N];网络世界;2001年
8 李俊;在线培训[N];华北电力报;2002年
9 吴超;e-Learning企业国际化之路[N];大众科技报;2002年
10 中国社科院互联网发展研究中心主任 吕本富;e-Learning:这个e里有黄金[N];中国经营报;2001年
中国博士学位论文全文数据库 前10条
1 Alireza Nasiri;[D];大连理工大学;2010年
2 李建新;学习型组织的组织结构设计及组织学习能力测评研究[D];天津大学;2010年
3 阿达西(Adahi Moulaye M'Hamed Taher);基于性格类型和学习方法的影响兼职MBA学生学业表现主要因素分析[D];浙江大学;2012年
4 何所惧;人工智能在游戏中的应用:游戏玩家的实时建模及对手的智能适配[D];北京邮电大学;2010年
5 贺正冰;通勤者路径选择机理及其对城市交通系统的影响[D];天津大学;2011年
6 诺迪拉;乌兹别克斯坦的国际和国内投资法规范的互动研究[D];大连海事大学;2012年
7 奥自然(Ozren Djuric Mikusevic);渐行渐近:中欧友好关系模式研究[D];吉林大学;2012年
8 冯云龙;统计学习理论中基于核的算法研究[D];中国科学技术大学;2012年
9 西索克(Sissoko Yayahabib);撒哈拉以南非洲的伊斯兰教政治化[D];吉林大学;2011年
10 彭文辉;网络学习行为分析及建模[D];华中师范大学;2012年
中国硕士学位论文全文数据库 前10条
1 刘颖;基于情境认知的企业E-learning课程设计[D];上海师范大学;2010年
2 吴琼;面向个性化E-learning的知识需求与供应研究[D];东华大学;2011年
3 李洋;中小企业实施E-learning的实践研究[D];河南大学;2011年
4 高蕾蕾;集聚战略下的E-learning提供方商业模式研究[D];北京交通大学;2011年
5 王晓岚;E-learning系统中知识资源的按需定制与服务组合方法研究[D];山东大学;2012年
6 潘毅龙;厦门海事局E-learning培训研究[D];西南交通大学;2011年
7 袁心;基于EKP平台的中小型企业E-learning实施及应用研究[D];上海师范大学;2011年
8 姚海刚;HY公司引入E-learning培训法的研究[D];南京理工大学;2010年
9 乔卉;我国中学专题学习网站建设的研究[D];陕西师范大学;2012年
10 王晨光;“开放式虚拟课堂”在企业E-learning中的应用研究[D];上海师范大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026