收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

结合TD(0)的马尔可夫链扰动分析求解算法

徐义春  韩芳  
【摘要】:我们分析了马尔可夫链转移矩阵的扰动对平均报酬的影响,讨论了系统敏感性的计算。并结合TD(0)算法,给出马尔可夫链性能敏感性的在线算法以及简化算法。我们给出了数值计算以表明给出的算法是可行的。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 关恕;角谷猜想的证明[J];宝鸡文理学院学报(自然科学版);2005年03期
2 张雅清;罗洪林;;马尔可夫链在中国各地区人均GDP预测中的应用[J];山西师范大学学报(自然科学版);2006年02期
3 吴翠兰;;关于设备维修与更新决策问题的两种方法[J];北京工业职业技术学院学报;2007年04期
4 马源良;孟娟;金雪莲;李国新;;基于个性化需求的市场需求预测[J];中国电力教育;2008年S2期
5 高亚爽;蒋晓文;;基于马尔可夫链的服装销售预测模型的研究[J];国际纺织导报;2008年11期
6 高亚爽;蒋晓文;;马尔可夫链的服装销售预测模型的研究[J];四川丝绸;2008年04期
7 陈伯成;李英杰;刘文煌;;求解一类马尔可夫链方程的逆矩阵[J];数学的实践与认识;2009年13期
8 杨卫国;纪灵军;孙杰;;关于m重隐非齐次马尔可夫模型的混合性[J];江苏大学学报(自然科学版);2009年06期
9 王刈禾;;马尔可夫链的极限性态及应用[J];技术与市场;2010年05期
10 杨金英;白玉梅;;用母函数求解有限马尔可夫链问题[J];内蒙古民族大学学报;2010年02期
11 杨曙光,姚志扬,何耀;线性最小二乘逼近的定向扰动分析[J];数值计算与计算机应用;1983年01期
12 刘韶跃,杨向群;两参数马氏链的标准三点转移函数的微分性质[J];湘潭大学自然科学学报;1992年01期
13 赵德龙,郑家恒;教学效果的齐次马尔可夫链分析软件开发研究[J];山西大学学报(自然科学版);1994年01期
14 宋东平,SheldonXCLou;预防阈值控制策略及其实现[J];自动化学报;1997年03期
15 葛键;马尔可夫链在经济预测上的应用[J];陕西经贸学院学报;2000年04期
16 何江宏;陈启明;;基于Markov链的最优化预测模型及其应用研究[J];合肥学院学报(自然科学版);2006年01期
17 汪琳;;中国农产品比较优势动态分析[J];北方经济;2006年08期
18 吉少华;孙彦;柏文广;;基于马尔可夫链的固定使用周期废旧产品回收预测模型[J];北方经济;2006年20期
19 王学武;;有限非齐次马尔可夫链的强极限定理[J];南阳师范学院学报;2007年03期
20 李普红;;马尔可夫调制的随机微分方程的稳定性[J];黑龙江科技信息;2007年05期
中国重要会议论文全文数据库 前10条
1 徐义春;韩芳;;结合TD(0)的马尔可夫链扰动分析求解算法[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
2 彭志行;夏乐天;刘俊峰;;教学质量评价中的马尔可夫链方法[A];中国现场统计研究会第12届学术年会论文集[C];2005年
3 王秀峰;;串行生产线扰动分析新算法及仿真研究[A];科学决策与系统工程——中国系统工程学会第六次年会论文集[C];1990年
4 涂摹生;;排队网络的建模及扰动分析[A];科学决策与系统工程——中国系统工程学会第六次年会论文集[C];1990年
5 严姝娜;韦司滢;;改进权马尔可夫链实现对相依随机变量序列的预测[A];第10届计算机模拟与信息技术会议论文集[C];2005年
6 寇学智;张启义;方东;;基于改进灰色马尔可夫模型的交通运输量预测[A];中国运筹学会第九届学术交流会论文集[C];2008年
7 沈绿珠;王涛;;中国省区城市化水平的马尔可夫预测[A];中国优选法统筹法与经济数学研究会第七届全国会员代表大会暨第七届中国管理科学学术年会论文集[C];2005年
8 牛艳;费为银;陈超;李淑娟;;在机制转换金融市场中带有红利支付的最优消费投资问题研究[A];第四届中国智能计算大会论文集[C];2010年
9 刘喜华;吴育华;;无赔款优待类保单经营状况预测的吸收Markov链模型[A];2001年中国管理科学学术会议论文集[C];2001年
10 周晖;王玮;钮文洁;谢欣荣;;基于灰色马尔可夫链的能源市场占有率的研究[A];第16届全国灰色系统学术会议论文集[C];2008年
中国博士学位论文全文数据库 前10条
1 王烜;结构转换条件下利率期限结构建模及应用研究[D];哈尔滨工业大学;2009年
2 陈海燕;图上随机游动的若干问题[D];厦门大学;2004年
3 张乃敏;相容和不相容奇异线性方程组的算法与扰动分析[D];复旦大学;2003年
4 詹蓉;面向即时顾客化定制的个性化需求预测方法研究[D];华中科技大学;2008年
5 徐传胜;彼得堡数学学派的概率思想研究[D];西北大学;2007年
6 刘金禄;模糊决策权重灵敏度分析及其应用研究[D];大连理工大学;2004年
7 罗季;有限混合分布模型与线性模型的估计和检验问题[D];华东师范大学;2008年
8 段雪峰;几类非线性矩阵方程的理论与方法[D];湖南大学;2008年
9 童金英;复杂网络拓扑特征的理论研究及仿真分析[D];中南大学;2010年
10 向华;结构线性方程组的迭代方法与扰动分析[D];复旦大学;2006年
中国硕士学位论文全文数据库 前10条
1 王新蕾;上证综合指数的马氏性和时间序列模型的组合分析和预测[D];南京信息工程大学;2006年
2 马丽娜;若干强极限定理及其在广义Bethe树上奇偶马尔可夫链场上的应用[D];河北工业大学;2004年
3 孙豪杰;中国出口商品比较优势动态转换分析[D];同济大学;2008年
4 沈永梅;基于统计试验的马氏链点值预测方法和时间序列分析预测方法的比较分析[D];河海大学;2006年
5 刘东海;信用风险模型的破产问题[D];中南大学;2006年
6 丁晨华;基于模糊集和马尔可夫链的优化算法研究[D];上海交通大学;2011年
7 温海彬;马尔可夫链预测模型及一些应用[D];南京邮电大学;2012年
8 高卓;离散时间SM[K]/PH[K]/C(C=1,2)/FCFS排队系统的年龄过程[D];首都师范大学;2007年
9 沈亮;用游程理论证明Q过程唯一性准则[D];中南大学;2006年
10 张鹏;有负顾客到达的离散时间排队系统[D];北京交通大学;2008年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978