收藏本站
《1996中国控制与决策学术年会论文集》1996年
收藏 | 手机打开
二维码
手机客户端打开本文

一种增强式学习算法及其在控制中的应用

王直杰  方建安  邵世煌  
【摘要】:提出一种新的增强式学习算法——随机实值增强式学习算法(SRV),并将这种算法应用于倒立摆系统的学习控制。仿真结果表明SRV具有良好的在线学习性能。

【引证文献】
中国期刊全文数据库 前1条
1 李彬彬;陈铁军;;基于自适应神经模糊推理的倒立摆控制[J];微计算机信息;2007年22期
【共引文献】
中国期刊全文数据库 前10条
1 郑宇;罗四维;吕子昂;;基于模型的层次化强化学习算法[J];北京交通大学学报;2006年05期
2 孙若莹;李忱;赵刚;;基于强化学习的牛鞭效应对策模型[J];北京信息科技大学学报(自然科学版);2011年01期
3 李春贵,吴沧浦,刘永信;一种集成规划的SARSA(λ)强化学习算法[J];北京理工大学学报;2002年03期
4 刘向东;崔晓婷;王华;张宇河;;TD再励学习在卫星姿态控制中的应用[J];北京理工大学学报;2006年03期
5 毕金波,吴沧浦;有效的自适应λ即时差异学习(英文)[J];Journal of Beijing Institute of Technology(English Edition);1999年03期
6 王雪松,程玉虎,彭光正;Modeling and Simulation of Time Series Prediction Based on Dynamic Neural Network[J];Journal of Beijing Institute of Technology(English Edition);2004年02期
7 林海,孙吉贵;预测及其主要模型的实现系统[J];吉林大学学报(信息科学版);2002年04期
8 杨东,殷苌茗,陈焕文,吴柏森;基于Q-学习的非线性控制[J];长沙电力学院学报(自然科学版);2003年01期
9 殷苌茗,王汉兴,陈焕文,谢丽娟;基于有效跟踪的平均渐进瞬时差分学习遗忘算法(英文)[J];长沙电力学院学报(自然科学版);2003年04期
10 吕志来,张保会,哈恒旭;一种变结构的时间序列预测算法及其在电力系统暂态稳定预测中的应用[J];电工技术学报;2002年03期
中国重要会议论文全文数据库 前10条
1 陈泰任;曹卫华;吴敏;雷琪;;一种新的集成模型在焦炉火道温度软测量中的应用[A];第二十六届中国控制会议论文集[C];2007年
2 ;Reinforcement Strategy Using Quantum Amplitude Amplification for Robot Learning[A];第二十六届中国控制会议论文集[C];2007年
3 ;Sample-Based Potentials Estimation for the Optimal Control of Stochastic System[A];中国自动化学会控制理论专业委员会D卷[C];2011年
4 郭成安;李建华;李明伟;;从观测数据学习后验概率函数:一种最佳神经网络模型的设计与分析[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
5 胡光华;;平均准则TD策略迭代算法[A];中国运筹学会第六届学术交流会论文集(上卷)[C];2000年
6 胡光华;殷英;李世云;;即时差分策略迭代算法[A];中国运筹学会第七届学术交流会论文集(下卷)[C];2004年
7 陈焕文;谢丽娟;谢建平;;TD方法与BP神经网络结合构造预测学习系统的算法分析与实现[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
8 王珏;程然;王骄;;人工神经元网络结合TD(λ)算法在中国象棋机器博弈中的应用[A];2009中国控制与决策会议论文集(2)[C];2009年
9 ;An Adaptive Inventory Control for a Supply Chain[A];2009中国控制与决策会议论文集(3)[C];2009年
10 陈春林;陈宗海;卓睿;;分层式强化学习的定性空间表达[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 林龙信;仿生水下机器人的增强学习控制方法研究[D];国防科学技术大学;2010年
2 陈学松;强化学习及其在机器人系统中的应用研究[D];广东工业大学;2011年
3 蔡军;家电产品市场营销研究[D];天津大学;2010年
4 李珺;基于强化学习的多机器人追捕问题研究[D];哈尔滨工业大学;2010年
5 徐一帆;天基海洋移动目标监视的联合调度问题研究[D];国防科学技术大学;2011年
6 董孟高;基于Agent的自适应系统运行机制及其构造技术研究[D];国防科学技术大学;2011年
7 李鑫;基于强化学习理论的网络拥塞控制算法研究[D];东北大学;2009年
8 金卓军;逆向增强学习和示教学习算法研究及其在智能机器人中的应用[D];浙江大学;2011年
9 张涛;非线性系统控制策略的研究[D];浙江大学;2001年
10 徐昕;增强学习及其在移动机器人导航与控制中的应用研究[D];国防科学技术大学;2002年
中国硕士学位论文全文数据库 前10条
1 李志强;Q学习在单路口交通信号控制中的应用研究[D];长沙理工大学;2010年
2 柴雪霞;基于强化学习的Web服务组合优化研究[D];合肥工业大学;2011年
3 黄付亮;联合博弈框架下的多Agent强化学习算法研究[D];太原科技大学;2011年
4 方珍;基于Android平台的中国象棋设计与实现[D];电子科技大学;2011年
5 王明明;基于强化学习的机械臂控制研究[D];华中科技大学;2009年
6 任建功;基于强化学习的自主式移动机器人导航控制[D];哈尔滨工业大学;2010年
7 李兆斌;自主移动机器人导航与控制中的增强学习方法研究[D];国防科学技术大学;2010年
8 宗露艳;强化学习和相关反馈在口腔正畸图像检索中的应用[D];江苏科技大学;2011年
9 赵俊杰;中高速单体船流体动力学性能和结构特性综合优化研究[D];江苏科技大学;2011年
10 左磊;基于值函数逼近与状态空间分解的增强学习方法研究[D];国防科学技术大学;2011年
【同被引文献】
中国期刊全文数据库 前2条
1 宋君烈,肖军,徐心和;倒立摆系统的Lagrange方程建模与模糊控制[J];东北大学学报;2002年04期
2 郭钊侠,方建安,苗清影;倒立摆系统及其智能控制研究[J];东华大学学报(自然科学版);2003年02期
【二级引证文献】
中国期刊全文数据库 前1条
1 李宇成;岳春然;王目树;;基于遗传算法的倒立摆系统的多级控制研究[J];北方工业大学学报;2009年03期
中国硕士学位论文全文数据库 前2条
1 马巍;电动汽车铅酸蓄电池特性建模与荷电状态估计[D];长安大学;2009年
2 孙建勤;两轮自平衡小车大范围镇定方法研究[D];西安电子科技大学;2010年
【相似文献】
中国期刊全文数据库 前10条
1 马志涛;侯涛;张红兵;董海鹰;;倒立摆系统的T-S模糊控制研究[J];微计算机信息;2006年28期
2 刘田踪;;基于模型匹配技术的倒立摆系统[J];电子测试;2010年10期
3 于铁利;于涛;;基于二次型最优调节器的倒立摆系统[J];电脑知识与技术;2010年24期
4 于丁文,金伟,胡晗,王齐胜;一种倒立摆的控制方案[J];仪器仪表学报;2005年S2期
5 曾志新;邹海明;李伟光;周建辉;;倒立摆系统的建模及MATLAB仿真[J];新技术新工艺;2005年10期
6 侯涛;董海鹰;;直线二级摆的双闭环串级模糊控制研究[J];兰州交通大学学报;2008年01期
7 杨骏进;;基于时滞观测器的倒立摆鲁棒控制[J];大众科技;2009年05期
8 易杰;谢贤金;;倒立摆系统的最优控制应用研究[J];自动化与仪器仪表;2011年02期
9 李湘清;孙秀霞;王栋;李士波;刘艳芳;;递推最小二乘法在LQR参数调整中的应用[J];弹箭与制导学报;2007年04期
10 刘珊中,朱邦太,邓兵;基于H_∞控制的倒摆平衡系统鲁棒性研究[J];电光与控制;2000年02期
中国重要会议论文全文数据库 前10条
1 王直杰;方建安;邵世煌;;一种增强式学习算法及其在控制中的应用[A];1996中国控制与决策学术年会论文集[C];1996年
2 许晓彦;郑华耀;Janusz Mindykowski;;主机高温淡水冷却水温自适应控制研究[A];2003年中国智能自动化会议论文集(上册)[C];2003年
3 巨永锋;蔺广逢;龙水根;包旭;;智能压路机压实模糊神经网络控制及仿真[A];2005全国自动化新技术学术交流会论文集(二)[C];2005年
4 崔栋刚;张彦斌;苏彦民;;纯滞后过程控制算法的研究[A];第16届中国过程控制学术年会暨第4届全国故障诊断与安全性学术会议论文集[C];2005年
5 李凌;苗鑫;袁德成;;基于神经网络控制的倒立摆系统仿真研究[A];第九届全国信息获取与处理学术会议论文集Ⅰ[C];2011年
6 袁韬;陈皓;兰杰;;倒立摆自抗扰控制算法简易实现[A];2010年西南三省一市自动化与仪器仪表学术年会论文集[C];2010年
7 于丁文;金伟;胡晗;王齐胜;;一种倒立摆的控制方案[A];第七届青年学术会议论文集[C];2005年
8 杨亚炜;张明廉;;倒立摆系统的运动模态分析[A];西部大开发 科教先行与可持续发展——中国科协2000年学术年会文集[C];2000年
9 李晔;;基于遗传算法和神经网络的二级倒立摆控制系统[A];第25届中国控制会议论文集(中册)[C];2006年
10 崔桂梅;秦力舒;洪晓英;柴燕;;一种模糊逻辑系统与线性系统理论结合的单级倒立摆控制方法[A];全国冶金企业计控网络化研讨会论文集[C];2003年
中国重要报纸全文数据库 前1条
1 陈先龙;微观交通仿真软件VISSIM[N];中国交通报;2004年
中国博士学位论文全文数据库 前10条
1 张克勤;滑模变结构控制理论及其在倒立摆系统中的应用研究[D];浙江大学;2003年
2 王玉坤;自适应逆控制及其应用的研究[D];哈尔滨工程大学;2006年
3 陈勇;深海采矿移动机器人的鲁棒控制研究[D];中南大学;2009年
4 朱立达;车铣加工中心动态特性及其加工机理的仿真与实验研究[D];东北大学 ;2010年
5 瞿少成;不确定系统的滑模控制理论及应用研究[D];华中科技大学;2005年
6 张燕锋;三废锅炉智能控制系统的研究与应用[D];昆明理工大学;2011年
7 周凌柯;数据校正技术的研究及应用[D];浙江大学;2005年
8 孙宁;人工免疫优化算法及其应用研究[D];哈尔滨工业大学;2006年
9 谢珺;二进制粒神经网络研究及其在故障诊断中的应用[D];太原理工大学;2009年
10 高兴泉;时域约束T-S模糊系统的控制方法研究[D];吉林大学;2006年
中国硕士学位论文全文数据库 前10条
1 狄艳坤;神经网络技术在倒立摆系统中的应用研究[D];哈尔滨理工大学;2010年
2 焦灵侠;模糊控制在倒立摆系统中的应用研究[D];西安工业大学;2010年
3 王玉琢;基于模糊神经网络的倒立摆系统控制研究[D];哈尔滨理工大学;2010年
4 汪涛;模糊神经网络控制在单级倒立摆系统中的应用[D];合肥工业大学;2004年
5 翟龙余;倒立摆的模糊控制研究[D];江南大学;2008年
6 李新飞;多级倒立摆控制技术的研究[D];哈尔滨工程大学;2006年
7 郭刚;自适应神经模糊控制策略在倒立摆系统中的研究[D];太原理工大学;2004年
8 钱征;基于强化学习的倒立摆控制研究[D];北京工业大学;2005年
9 王瑞霞;基于强化学习的倒立摆控制[D];北京工业大学;2005年
10 黄苑虹;倒立摆系统的稳定控制研究[D];广东工业大学;2002年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026