收藏本站
收藏 | 论文排版

优化策略模型下的匹配律算法

程振波  邓志东  
【摘要】:利用基于部分可观马尔可夫决策过程的策略搜索模型,提出了一种具有优化行为的策略搜索算法,并推导出满足匹配律的策略算法.被试可通过调整策略参数,最大化目标值函数的期望值,并根据已往的经验调整策略参数.假定被试所处的环境具有马尔可夫性,通过计算值函数期望值的梯度可求得优化行为的策略搜索算法.理论分析与仿真结果表明,如果策略参数与值函数的期望值仅受当前经验的影响,则可由获得优化行为的策略算法推导出符合匹配律的策略算法.研究结果揭示了匹配行为与优化策略搜索算法之间的关系,表明满足匹配律的决策行为是一类达到次优的决策行为.

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王学军;;数据挖掘技术在企业管理中应用的研究和探索[J];商场现代化;2006年10期
2 杨兆升,陈昕,胡娟娟,蔡长青;城市交通区域智能协调控制研究[J];交通与计算机;2005年04期
3 于德新;杨兆升;王媛;孙建平;;基于多智能体的城市道路交通控制系统及其协调优化[J];吉林大学学报(工学版);2006年01期
4 曹裕华,江敬灼;基于态势评估的实体决策行为模拟[J];计算机仿真;2004年12期
5 李海晨;冯玉强;;基于定性仿真的谈判模型研究[J];哈尔滨工业大学学报;2007年12期
6 郑国忠;;主题检索原理及结构模型[J];科技信息(科学教研);2008年18期
7 郑运平;;一种基于格雷码的TNAM优化策略[J];华中科技大学学报(自然科学版);2010年06期
8 李成;肖胜;;不完全信息下的CGF主体决策研究[J];舰船电子对抗;2008年06期
9 孙占山;决策支持系统研究提纲[J];大连海事大学学报;1992年01期
10 刘子龙;;基于模式比较的C2C在线消费决策行为研究[J];管理现代化;2007年05期
11 黄河;;基于树的多因素平衡组卷模型及算法设计[J];计算机系统应用;2008年04期
12 仲辉;陈超;王维平;李群;;基于π演算的指挥决策行为形式化建模研究[J];系统仿真学报;2007年15期
13 王海琳;;论分治策略算法的具体实现[J];科技资讯;2007年15期
14 冉启兵;地理信息系统空间分析在决策行为中的应用[J];福建建筑高等专科学校学报;1999年01期
15 贝志城;QDSS为企业增强竞争优势[J];市场观察;1999年04期
16 王大丁;陈悦峰;;基于CAS理论的战时装备物流仿真模型[J];中国物流与采购;2007年24期
17 李熙;徐德智;;本体映射中一种基于WordNet名称策略算法[J];微计算机信息;2009年15期
18 阮俊杰;;群决策支持系统的新发展[J];计算机工程与科学;1992年02期
19 王泊;史佩雯;田启家;史忠植;;协商支持系统中的模型管理框架[J];计算机科学;2002年10期
20 魏宾;胡晓峰;司光亚;温百华;;战略指挥员智能决策算法研究[J];计算机仿真;2006年01期
中国重要会议论文全文数据库 前8条
1 程振波;邓志东;;优化策略模型下的匹配律算法[A];2009年中国智能自动化会议论文集(第五分册)[东南大学学报(增刊)][C];2009年
2 刘润才;谢国新;潘大志;;基于HLA的两栖步兵战车CGF研究[A];2009系统仿真技术及其应用学术会议论文集[C];2009年
3 龙德;章云;;铁水运输系统智能调度建模与仿真[A];2009年中国智能自动化会议论文集(第二分册)[C];2009年
4 龙德;彭宏;;铁水运输系统行车调度建模与仿真研究[A];2007中国控制与决策学术年会论文集[C];2007年
5 鲁玲;;MCGS与MATLAB的DDE通讯设计[A];2009系统仿真技术及其应用学术会议论文集[C];2009年
6 梁娟;林元庆;;基于技术创新的产业集群行为的Swarm仿真[A];2006中国控制与决策学术年会论文集[C];2006年
7 陈生;段永新;;企业决策层高级职员考核指标的系统设计[A];中国人类工效学学会第六次学术交流会论文摘要汇编[C];2003年
8 金炜东;;仿真的进行可能先于系统完全建模[A];新观点新学说学术沙龙文集37:仿真是基于模型的实验吗[C];2009年
中国博士学位论文全文数据库 前10条
1 曾庆群;移动商务决策行为及其价值形成研究[D];华中科技大学;2010年
2 宗文;组织内部员工对信息技术/信息系统(IT/IS)主动采纳的决策行为研究[D];南京师范大学;2012年
3 白晨;文献数据库系统用户检索决策中的学习行为研究[D];南京理工大学;2010年
4 陈中祥;基于BDI Agent的CGF主体行为建模理论与技术研究[D];华中科技大学;2004年
5 宋一兵;计算机生成兵力中智能体技术与应用研究[D];哈尔滨工程大学;2006年
6 赵凛;基于“前景理论”的出行决策模型及ATIS仿真实验研究[D];北京交通大学;2007年
7 张德成;基于商家、消费者和发行机构决策行为的电子货币研究[D];上海交通大学;2007年
8 孙俊;人脸图像分析和识别方法研究[D];清华大学;2001年
9 翟石艳;实验人文地理学基本理论与技术平台研究[D];华东师范大学;2013年
10 杨智勇;ERP实施评价若干问题研究[D];天津大学;2009年
中国硕士学位论文全文数据库 前10条
1 邱莉榕;支持创新概念设计的多Agent系统[D];山东师范大学;2004年
2 王跃;电磁兼容分析系统(EMC)中动态链路跟踪策略的研究与仿真[D];吉林大学;2009年
3 李君梅;基于Web Community识别的聚焦爬虫算法研究与设计[D];浙江大学;2008年
4 宋亚楠;平面Ramsey数PR(K_4-e,K_6)和PR(C_4,K_7)的研究[D];大连理工大学;2007年
5 李龙;基于价值的机器学习方法及其在RoboCup仿真2D中的应用[D];合肥工业大学;2009年
6 王霞;基于多策略算法排课系统研究[D];西北农林科技大学;2010年
7 黄川林;基于Internet的ICAI系统研究与设计[D];哈尔滨工程大学;2005年
8 冯月;基于专业搜索引擎网络蜘蛛搜索策略研究[D];电子科技大学;2007年
9 陆青;基于对偶理论的APPA组合协商研究及最佳投标策略算法的实现[D];上海交通大学;2007年
10 应钦;信息采集中的高效多策略方法研究[D];北京邮电大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978