收藏本站
《第二十六届中国控制会议论文集》2007年
收藏 | 手机打开
二维码
手机客户端打开本文

基于对等SAP的Q学习在机器人作业分配中的应用

丁丽洁  唐昊  周雷  
【摘要】:基于强化学习,文章讨论了高速搬运系统中多个机器人的作业分配问题。针对状态空间随机器人个数增加呈指数增大这一难题,提出对等状态-行动对(State-Action Pair)概念,设计了一种改进的Q学习算法。在该算法中,每次采取一个行动后,更新相应的所有对等SAP的Q值,且只需保存其中一个SAP的Q值。与标准Q学习相比,该算法能够节省存储空间,提高系统的学习效率。

手机知网App
【参考文献】
中国期刊全文数据库 前5条
1 孟伟,洪炳镕,韩学东;一种多机器人协作控制方法[J];机器人;2004年01期
2 周浦城,洪炳镕,郭耸;基于强化学习的多机器人协作[J];计算机工程与应用;2005年28期
3 孟庆鑫,李平,郭黎滨,王立权;多机器人协作技术分析及其实验系统设计[J];制造业自动化;2004年11期
4 唐昊;周雷;袁继彬;;平均和折扣准则MDP基于TD(0)学习的统一NDP方法[J];控制理论与应用;2006年02期
5 ;Performance Potential-based Neuro-dynamic Programming for SMDPs[J];自动化学报;2005年04期
【共引文献】
中国期刊全文数据库 前10条
1 宋天恒;李大字;高彦臣;;分布式Q学习多目标函数优化策略[J];北京化工大学学报(自然科学版);2011年05期
2 张永靖;唐恬;陈杰;;采用强化学习的自治联合会话接纳控制[J];北京邮电大学学报;2007年04期
3 程玉虎,易建强,王雪松,赵冬斌;一类连续状态与动作空间下的加权Q学习[J];电机与控制学报;2005年06期
4 梁冰,洪炳镕,曙光;自主机器人视觉与行为模型及避障研究[J];电子学报;2003年S1期
5 李默;徐友云;蔡跃明;;基于Q-Learning的认知无线电系统感知管理算法[J];电子与信息学报;2010年03期
6 刘鑫;阚兴一;王三强;;认知无线网络中基于随机博弈框架的频率分配[J];辽宁工程技术大学学报(自然科学版);2011年05期
7 林粤伟;;An autonomic joint radio resource management algorithm in end-to-end reconfigurable system[J];High Technology Letters;2008年03期
8 王国磊;钟诗胜;林琳;;基于聚类状态隶属度的动态调度Q-学习[J];高技术通讯;2009年04期
9 么刚;张武;王劲林;;基于分级代理的智能家庭网络模型研究[J];高技术通讯;2009年09期
10 黄艳国;唐军;许伦辉;;基于Agent的城市道路交通信号控制方法[J];公路交通科技;2009年10期
中国重要会议论文全文数据库 前7条
1 ;Reinforcement Strategy Using Quantum Amplitude Amplification for Robot Learning[A];第二十六届中国控制会议论文集[C];2007年
2 任玲;唐昊;周雷;魏振春;;一种能量高效的无线传感器网络自适应传输方法[A];中国自动化学会控制理论专业委员会B卷[C];2011年
3 ;Hybrid Q-learning Algorithm About Cooperation in MAS[A];2009中国控制与决策会议论文集(3)[C];2009年
4 ;An Adaptive Inventory Control for a Supply Chain[A];2009中国控制与决策会议论文集(3)[C];2009年
5 ;Multi-Agent Coordination Based on Distributed Reinforcement Learning and Its Application to Robot Soccer[A];第二十三届中国控制会议论文集(上册)[C];2004年
6 杜琳;石慧;刘晓平;;一种基于Q学习的任务调度算法的改进研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
7 陆慧;王金田;;单个销售商垄断电子销售市场的动态定价研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
中国博士学位论文全文数据库 前10条
1 张琦;多核系统中的程序性能优化研究[D];中国科学技术大学;2010年
2 李宪华;服务机器人双臂协作技术研究及实现[D];上海大学;2011年
3 邵杰;基于学习分类器的多机器人路径规划关键技术研究[D];南京理工大学;2011年
4 王宏;煤矿机器人激光雷达与惯性传感器导航理论及实验研究[D];中国矿业大学(北京);2011年
5 王笑蓉;蚁群优化的理论模型及在生产调度中的应用研究[D];浙江大学;2003年
6 王醒策;基于强化学习和群集智能方法的多机器人协作协调研究[D];哈尔滨工程大学;2005年
7 程磊;多移动机器人协调控制系统的研究与实现[D];华中科技大学;2005年
8 沈猛;轮式移动机器人导航控制与路径规划研究[D];西北工业大学;2006年
9 冯伟兴;群体机器人的运动行为基础研究[D];哈尔滨工程大学;2006年
10 董炀斌;多机器人系统的协作研究[D];浙江大学;2006年
中国硕士学位论文全文数据库 前10条
1 姜新丽;基于强化学习的多机器人协作控制方法研究[D];沈阳理工大学;2010年
2 唐凯;多智能小车一致性分析及测控系统硬件平台研究[D];西安电子科技大学;2011年
3 吴晓庆;基于认知的异构网络选择技术的研究[D];西安电子科技大学;2011年
4 樊亚雄;移动Ad Hoc网络路由协议研究[D];西安电子科技大学;2011年
5 龙春燕;适用于MIMO链路的Ad Hoc网络多址接入与路由协议研究[D];西安电子科技大学;2011年
6 任玲;无线传感器网络能量高效的传输策略研究[D];合肥工业大学;2011年
7 毛沙;无线传感器网络节能优化策略研究[D];合肥工业大学;2011年
8 汤琼;分布式发电能量管理系统平台的构建与开发[D];广东工业大学;2011年
9 黄付亮;联合博弈框架下的多Agent强化学习算法研究[D];太原科技大学;2011年
10 李晶;认知多媒体传感器网络中的中继协作和功率控制研究[D];中南大学;2011年
【二级参考文献】
中国期刊全文数据库 前3条
1 王越超,谈大龙;协作机器人学的研究现状与发展[J];机器人;1998年01期
2 唐昊,奚宏生,殷保群;Markov控制过程基于单个样本轨道的在线优化算法[J];控制理论与应用;2002年06期
3 顾新兴,冯纯伯,刘伟,黄亚楼,蒋喜华,安刚,刘景泰,卢桂章;双机械臂协调:以运动学为基础的模型分析与动态补偿控制方法[J];控制理论与应用;1994年02期
【相似文献】
中国期刊全文数据库 前10条
1 王田苗;拼搏开拓 与时俱进——访机器人技术主题专家组组长王田苗教授[J];机器人技术与应用;2003年01期
2 唐辉宇;;农业用机器人[J];湖南农机;2006年06期
3 ;机器人技术与应用全年总目次[J];机器人技术与应用;2008年06期
4 ;Automan展出ABB的新型机器人[J];机器人情报;1994年01期
5 Udo Hipp ,Edgar Grundler;快速 准确 及时[J];现代制造;2005年26期
6 张秋华;;机器人在包装工程中的实际应用[J];齐齐哈尔大学学报(自然科学版);2011年02期
7 下山勲;张炜;;未来家用机器人设想与研究[J];机器人技术与应用;2011年02期
8 王启霞;黄荣英;;机器人面临着更高的要求[J];机器人情报;1994年02期
9 王伟;;ABB推出最新机器人技术——访ABB机器人部(中国区)客户服务部孔兵经理[J];机器人技术与应用;2007年06期
10 ;上海国际先进机器人技术发展论坛在上海隆重召开[J];伺服控制;2007年06期
中国重要会议论文全文数据库 前10条
1 丁丽洁;唐昊;周雷;;基于对等SAP的Q学习在机器人作业分配中的应用[A];第二十六届中国控制会议论文集[C];2007年
2 吴仲城;葛运建;戈瑜;;机器人技术是先进制造业发展的基础[A];2004“安徽制造业发展”博士科技论坛论文集[C];2004年
3 缪妙;;手术机器人简介[A];2011年浙江省医学会医学工程学分会第九届学术年会论文汇编[C];2011年
4 张殿明;时会美;;农业自动化领域中的机器人技术[A];Proceedings of 2010 National Vocational Education of Communications and Information Technology Conference (2010 NVCIC)[C];2010年
5 刘宏;孙奎;谢宗武;李操;;月球及行星探测的机器人技术[A];中国宇航学会深空探测技术专业委员会第七届学术年会论文集[C];2010年
6 薛子云;;以“Future Star”为平台的机器人课程的研究与创新[A];北京高教学会实验室工作研究会2010年学术研讨会论文集(上册)[C];2010年
7 祝庆智;;ABB机器人在铸造组芯整体浸涂上的应用[A];2010年中国铸造活动周论文集[C];2010年
8 于季刚;黄玮;庄明峰;吴双临;;大学工科开设机器人技术实践性课程的初探[A];第十六届电工理论学术年会论文集[C];2004年
9 杨朝虹;张海珠;;机器人技术的应用与发展[A];先进制造技术论坛暨第五届制造业自动化与信息化技术交流会论文集[C];2006年
10 张国伟;李斌;陈丽惠;胡国辉;龚海里;;核工业电随动主从机械手控制系统研制[A];第八届全国信息获取与处理学术会议论文集[C];2010年
中国重要报纸全文数据库 前10条
1 本报记者 何腾江 实习生 陈施雅;机器人技术如何与地方产业有机结合[N];中山日报;2008年
2 记者 杨文利;中国首次举办大规模机器人技术研讨会[N];中国高新技术产业导报;2009年
3 本报首席记者 姜澎;给机器人做规矩,要赶紧了?[N];文汇报;2011年
4 本报记者 程宇婕;我国将建全球最大基地[N];中国能源报;2010年
5 深圳商报记者 吴素红;美女机器人“秀外慧中”[N];深圳商报;2010年
6 本报记者 李婵;我国启动可感知机器人项目[N];北京科技报;2011年
7 小雄;机器人技术在药品包装线上的应用分析[N];中国包装报;2011年
8 本报记者 姜泓冰;机器人何时成为生活伴侣[N];人民日报;2011年
9 本报记者 邵岭;谁更需要规矩,机器还是人?[N];文汇报;2011年
10 本报记者 李响;机器人 最好的时光[N];计算机世界;2011年
中国博士学位论文全文数据库 前10条
1 赵立军;室内服务机器人移动定位技术研究[D];哈尔滨工业大学;2009年
2 白相林;水平井牵引机器人关键技术研究[D];哈尔滨工业大学;2010年
3 侍才洪;一种伤员换乘转运机器人的设计研究[D];中国人民解放军军事医学科学院;2010年
4 刘利枚;机器人同时定位与建图方法研究[D];中南大学;2012年
5 吴培良;家庭智能空间中服务机器人全息建图及相关问题研究[D];燕山大学;2010年
6 路光达;基于仿生行为的移动机器人主动嗅觉技术研究[D];河北工业大学;2011年
7 吕晓玲;基于听觉信息的机器人声源定位技术研究[D];河北工业大学;2010年
8 王扬威;仿生墨鱼机器人及其关键技术研究[D];哈尔滨工业大学;2011年
9 刘冠群;救援机器人仿生感知技术研究[D];哈尔滨工程大学;2012年
10 仲训昱;遥自主移动机器人运动规划与控制技术研究[D];哈尔滨工程大学;2009年
中国硕士学位论文全文数据库 前10条
1 杨波;可穿戴抑震机器人抑震控制策略的研究[D];哈尔滨工业大学;2010年
2 矫德余;基于嵌入式系统的智能巡检机器人研制[D];中国石油大学;2010年
3 赵鹏翀;一种基于粒子群算法的机器人群体地形探索研究[D];上海交通大学;2010年
4 张家飞;机器人群体协同任务规划与协调避碰[D];哈尔滨工程大学;2010年
5 周毅漳;基于自抗扰控制的双轮自平衡机器人[D];福建农林大学;2010年
6 伊婧;基于强化学习的机器人行为学习[D];沈阳工业大学;2011年
7 彭朔;基于神经网络的核电站检修机器人的智能控制研究[D];华北电力大学(北京);2010年
8 姜伟;仿袋鼠跳跃机器人的控制问题研究[D];北方工业大学;2010年
9 余冠华;用于超市机器人的环境建模方法研究[D];沈阳工业大学;2010年
10 闫珍雷;基于粒子群算法的灭火机器人改造[D];西安科技大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026