收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于马尔可夫决策过程和DT-Golog的动态工作流集成

金杨恒  曾伟  
【摘要】:马尔可夫决策过程是确定性动态规划和马尔可夫过程结合的产物,是研究随机环境下多阶段决策过程优化问题的理论工具。DT-Golog是将马尔可夫决策过程引入Golog逻辑编程语言的扩展。本文针对动态工作流集成问题中业务逻辑的不确定性,利用DT-Golog对动态工作流集成问题进行建模,结合编程和规划二者的优点,最后得到最优策略。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王蓁蓁;邢汉承;;双马尔可夫决策过程联合模型[J];计算机科学;2009年09期
2 喻建鹏;桂建平;;强化学习研究综述[J];电脑知识与技术;2008年15期
3 肖力;束雄英;查亚兵;;基于支持样本的快速增强学习算法[J];微计算机信息;2009年24期
4 陈学松;杨宜民;;强化学习研究综述[J];计算机应用研究;2010年08期
5 汪定伟;T.J.Hodgson;;多阶段生产系统的PUSH/PULL混合控制策略[J];控制与决策;1992年02期
6 刘甜甜;贾智平;Edwin H.-M.Sha;;最短路径树的马尔可夫有限阶段决策算法[J];计算机科学;2007年08期
7 郑宇;罗四维;吕子昂;;强化学习算法的稳定状态空间控制[J];计算机应用;2008年05期
8 刘亮;李龙澍;;基于局部合作的RoboCup多智能体Q-学习[J];计算机工程;2009年09期
9 余涛;周斌;甄卫国;;强化学习理论在电力系统中的应用及展望[J];电力系统保护与控制;2009年14期
10 石轲;陈小平;;行动驱动的马尔可夫决策过程及在RoboCup中的应用[J];小型微型计算机系统;2011年03期
11 王耀南;周原力;谭磊;杨易旻;;输电线路除冰机器人行为控制研究[J];控制工程;2011年03期
12 孙娟,窦万春;Multi-agent系统中认知协作研究[J];计算机应用;2005年10期
13 林联明;王浩;王一雄;;基于神经网络的Sarsa强化学习算法[J];计算机技术与发展;2006年01期
14 赵海峰;姜兴宇;王贵和;王宛山;;基于马尔可夫决策过程的MES系统动态调度方法[J];东北大学学报(自然科学版);2007年08期
15 王晓伶;慕德俊;刘哲元;;无线传感器网络中基于MDP的MAS协作策略的优化及分布执行[J];传感技术学报;2009年04期
16 程文娟;唐昊;李豹;周雷;;一种MDP基于性能势的并行Q学习算法[J];系统仿真学报;2009年09期
17 金卓军;钱徽;朱淼良;;基于倾向性分析的轨迹评测技术[J];浙江大学学报(工学版);2011年10期
18 王利存,郑应平;可重入生产系统的递阶增强型学习调度[J];信息与控制;2001年03期
19 张润梅;王浩;张佑生;姚宏亮;方长胜;;基于内部结构MPOMDP模型的策略梯度学习算法[J];计算机工程与应用;2009年07期
20 余涛;周斌;陈家荣;;基于Q学习的互联电网动态最优CPS控制[J];中国电机工程学报;2009年19期
中国重要会议论文全文数据库 前3条
1 金杨恒;曾伟;;基于马尔可夫决策过程和DT-Golog的动态工作流集成[A];全国第十届企业信息化与工业工程学术年会论文集[C];2006年
2 汪定伟;;生产存储控制的Push/Pull混合策略优化的计算方法[A];1992年中国控制与决策学术年会论文集[C];1992年
3 蔡文澜;王俊生;陶军;徐惠斌;马宏绪;;一种PEGASUS策略梯度算法的理论及应用[A];中国仪器仪表学会第九届青年学术会议论文集[C];2007年
中国博士学位论文全文数据库 前2条
1 高英明;无线传感器网络能量管理技术与理论研究[D];大连理工大学;2009年
2 杨晓辉;基于服务组织的开放Agent社会研究[D];天津大学;2012年
中国硕士学位论文全文数据库 前4条
1 张宏;PDM环境下的动态工作流管理技术的研究[D];华中科技大学;2004年
2 林联明;径向基函数网络和实例学习在强化学习中的应用[D];合肥工业大学;2005年
3 张洪宇;基于增强学习的移动机器人运动控制研究[D];国防科学技术大学;2008年
4 蔡文澜;基于增强学习的小型无人直升机控制方法研究[D];国防科学技术大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978