收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于Q-学习的进化博弈决策模型

刘伟兵  王先甲  
【摘要】:基于Q-强化学习算法,建立了进化博弈中代理人的决策模型.考虑到强化学习算法不需要建立环境模型,可以用于不完全、不确定信息问题中,将Q-强化学习算法引入到进化博弈中,研究了进化博弈中的两种Q一学习决策模型:单代理人Q-学习决策模型和多代理人Q-学习决策模型,并针对不同结构的进化博弈选择不同的决策模型和算法进行了讨论.仿真算例的结果说明基于Q-学习的决策模型能指导代理人学习、选择最优策略.

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 林孝贵,李炼,侯雁;中国企业面对外国保障措施的进化博弈分析[J];经济问题探索;2005年09期
2 田银华;唐利如;;产业集群演化发展的博弈分析[J];人文杂志;2006年04期
3 尹文厚;董红斌;;一种基于进化博弈的遗传算法改进策略[J];黑龙江科技信息;2008年36期
4 李亮;李海英;曾胜;;我国上市公司再融资监管博弈分析[J];学术论坛;2008年12期
5 李想;;农民专业合作社形成中的政府作用:一个进化博弈模型[J];科技经济市场;2009年07期
6 张根林;马果;;绿色营销中的进化博弈分析[J];统计与决策;2008年13期
7 于海东;吉炳安;罗云峰;;金融创新的定价战略和市场进化[J];武汉理工大学学报(信息与管理工程版);2008年05期
8 宋奇庆;付长贺;;关于双对称博弈中进化稳定策略的存在性[J];沈阳师范大学学报(自然科学版);2010年03期
9 孙广毅;贾书丽;姜海珠;;有限理性下基金投资者的博弈分析[J];中国市场;2010年52期
10 李庆峰;基于进化博弈原理的证券市场开放和信用建设研究[J];技术经济;2004年08期
11 赵晗萍,冯允成,蒋家东;进化博弈模型中有限理性个体学习机制设计框架[J];系统工程;2005年09期
12 赵晗萍;冯允成;蒋家东;;基于进化博弈的供应链市场进入博弈分析[J];计算机集成制造系统;2006年10期
13 武晨;;产业结构升级与贸易壁垒激增的进化博弈分析[J];商业时代;2009年05期
14 陆琳;;我国物流企业战略联盟的进化博弈研究[J];改革与战略;2009年05期
15 蔡翔;王晓燕;;企业内部横向信任关系的进化博弈分析[J];科技导报;2006年05期
16 谭冰清;张宁宁;;现代服务业与制造业的进化博弈分析——基于京津冀区域合作[J];现代商贸工业;2011年17期
17 黄海滨;吕晓敏;艾立志;;国内手机企业技术研发策略选择的进化博弈分析[J];商场现代化;2006年33期
18 朱庆华;窦一杰;;绿色供应链中政府与核心企业进化博弈模型[J];系统工程理论与实践;2007年12期
19 张永鹏;;证券监管机构与基金管理者的进化博弈分析[J];哈尔滨工业大学学报;2009年04期
20 张立刚,傅铅生;对B2C市场进化博弈的研究[J];华东经济管理;2005年08期
中国重要会议论文全文数据库 前10条
1 刘伟兵;王先甲;;基于Q-学习的进化博弈决策模型[A];和谐发展与系统工程——中国系统工程学会第十五届年会论文集[C];2008年
2 张树奎;鲁子爱;;港口污水处理监督的进化博弈分析[A];中国航海科技优秀论文集(2010)[C];2010年
3 张树奎;鲁子爱;;港口污水处理监督的进化博弈分析[A];中国航海学会内河海事专业委员会2010年度海事管理学术交流会优秀论文集[C];2010年
4 何利芳;陈洪转;;大型复杂产品主制造商与供应商间灰非对称进化博弈链模型研究[A];第19届灰色系统全国会议论文集[C];2010年
5 文锋;陈宗海;陈春林;;基于RLS-TD和值梯度的强化学习方法用于LQR控制问题[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
6 卓睿;陈宗海;陈春林;;强化学习在移动机器人导航上的应用[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
7 张伟;李建更;张家旺;;多智能体强化学习在机器人足球比赛中的应用[A];2005年中国智能自动化会议论文集[C];2005年
8 张家旺;韩光胜;张伟;;基于ASPL模型的多智能体强化学习在RoboCup中的应用[A];2005中国机器人大赛论文集[C];2005年
9 敬斌;田野;;Robocup中的传球策略[A];2005中国机器人大赛论文集[C];2005年
10 陈春林;陈宗海;卓睿;;分层式强化学习的定性空间表达[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 金钊;加速强化学习方法研究[D];云南大学;2010年
2 徐明亮;强化学习及其应用研究[D];江南大学;2010年
3 陈学松;强化学习及其在机器人系统中的应用研究[D];广东工业大学;2011年
4 朱美强;基于谱图理论的强化学习研究[D];中国矿业大学;2012年
5 仲宇;分布式强化学习理论及在多机器人中的应用研究[D];哈尔滨工程大学;2003年
6 李誌;基于视觉听觉语义相干性的强化学习系统的研究[D];太原理工大学;2012年
7 郭庆;多Agent系统协商中若干关键技术的研究[D];浙江大学;2003年
8 钟琪;危机应对体系评估与机制研究[D];中国科学技术大学;2010年
9 沃伟东;企业文化的经济学分析[D];复旦大学;2006年
10 阎铭;企业进化及其风险研究[D];武汉理工大学;2008年
中国硕士学位论文全文数据库 前10条
1 尹晓虎;多Agent协同的强化学习方法研究[D];国防科学技术大学;2003年
2 宋梅萍;多移动机器人协作任务的分布式决策控制系统[D];哈尔滨工程大学;2003年
3 卢方国;强化学习在个性化信息Agent的应用研究[D];广东工业大学;2004年
4 郭一明;基于强化学习的劣化系统维修策略研究[D];合肥工业大学;2011年
5 钱征;基于强化学习的倒立摆控制研究[D];北京工业大学;2005年
6 王瑞霞;基于强化学习的倒立摆控制[D];北京工业大学;2005年
7 顾鑫;个性化智能信息检索系统研究[D];哈尔滨工程大学;2004年
8 张驰;基于ROBOCUP的多智能体系统设计与实现[D];北京工业大学;2004年
9 袁继彬;大规模Markov系统基于性能势学习的NDP优化方法研究[D];合肥工业大学;2005年
10 汪向利;基于多Agent的生产计划与调度系统研究与开发[D];浙江工业大学;2006年
中国重要报纸全文数据库 前10条
1 孙佳宇;强化学习教育 增强服务意识[N];人民公安报;2009年
2 首席记者 朱丽华;强化学习 落实责任 确保取得实效[N];盘锦日报;2009年
3 王良豪 记者 刘伟 龙先华;通过创新工作取得活动效果[N];六盘水日报;2008年
4 书分;解放区审计局强化学习抓作风[N];焦作日报;2006年
5 记者 刘琰;强化学习 增强本领 扎实工作[N];周口日报;2009年
6 谭育才;强化学习 克己奉公[N];赤峰日报;2008年
7 章斌、特约记者夏吉龙;8710部队 破解难题强化学习教育效果[N];人民武警;2010年
8 通讯员 马全有;强化学习 搞好服务 解放思想[N];甘肃法制报;2007年
9 李北川;强化学习 找准问题 着力整改[N];凉山日报(汉);2007年
10 记者 刘莉 实习记者 刘慕欣;兵团党委“保先”教育活动督导组强化学习[N];兵团日报(汉);2005年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978