收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于改进前缀树PStree的最大序列模式挖掘

任家东  解玉洁  何海涛  张爱国  
【摘要】:针对现有最大序列模式挖掘算法候选序列模式过多以及可扩展性差的缺点,提出了一种基于序列匹配的最大序列模式挖掘算法CSMS(compare sequence finding maximal sequential pattern).算法首先为所有频繁1序列构建位置信息表;然后利用纵向、横向结合搜索位置信息表的序列扩展匹配方法找到潜在最大序列模式;在进行序列匹配扩展的同时,把每个找到的潜在最大序列模式存储在改进的前缀树PStree(prefix sequential pattern tree)中,树中每个结点链接到索引Hash表,Hash表中保存了结点的位置信息,对于那些重复的序列可以直接从Hash表中找到其位置信息;最后通过对前缀树PStree进行剪枝,得到由最大序列模式组成的前缀树MPStree(maximal sequential pattern tree).实验结果表明算法CSMS具有较好的时间效率和扩展性.

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 董辉;马垣;沈文轩;宫玺;汤新明;;基于交集为空的概念格批处理生成算法[J];广西师范大学学报(自然科学版);2007年04期
2 徐欣;阮幼林;;最大频繁模式的挖掘算法[J];舰船电子工程;2009年03期
3 阮幼林,李庆华,刘干;分布环境中的并行频繁模式挖掘算法[J];计算机工程与应用;2005年25期
4 才科扎西;黄景廉;;基于前缀树的高效频繁项集挖掘算法[J];计算机工程;2010年04期
5 阮幼林,李庆华,刘干;最大频繁模式的快速挖掘与更新算法[J];计算机工程与应用;2005年24期
6 王运鹏;胡修林;阮幼林;;一种最大频繁模式的快速挖掘算法[J];计算机应用研究;2006年10期
7 张坤;朱扬勇;;无重复投影数据库扫描的序列模式挖掘算法[J];计算机研究与发展;2007年01期
8 程江;易云飞;林建辉;余启港;;基于前缀树的模糊关联规则挖掘算法[J];计算机工程;2009年07期
9 刘杉;侯整风;;基于多域的计算几何流分类改进算法[J];计算机工程;2010年19期
10 吴彤,杨嗣超,诸鸿文;路由表快速查找算法[J];通信技术;2000年04期
11 汪红;涂旻骞;;基于前缀树的关联规则挖掘算法分析与设计[J];计算机与现代化;2008年08期
12 黎铭,薛晓冰,周志华;基于多示例学习的中文Web目录页面推荐[J];软件学报;2004年09期
13 张坤;陈越;朱扬勇;;一种基于前缀树的增量序列挖掘算法[J];计算机工程;2007年19期
14 况立群;熊风光;韩燮;;一种基于前缀编码的树生成算法[J];小型微型计算机系统;2010年05期
15 况立群;熊风光;韩燮;;基于前缀编码的先根遍历树生成算法的研究与应用[J];计算机应用与软件;2011年04期
16 由育阳;张健沛;杨志宏;由勇;;基于前缀树的数据流容错概要结构构造[J];北京航空航天大学学报;2011年05期
17 田里;;NIDS中正则表达式匹配电路的改进与优化[J];计算机工程;2010年03期
18 王龙;刘衍珩;李晓光;官健;;基于树型结构和加权熵的中文高频词提取算法[J];吉林大学学报(工学版);2011年01期
19 朱光喜;吴伟民;阮幼林;刘干;;一种基于前缀树的频繁模式挖掘算法[J];计算机科学;2005年04期
20 喻波;赵国鸿;陈曙晖;;一种基于共享前缀的两级索引结构[J];计算机工程与科学;2010年12期
中国重要会议论文全文数据库 前10条
1 任家东;解玉洁;何海涛;张爱国;;基于改进前缀树PStree的最大序列模式挖掘[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
2 王丽珍;陆叶;陈红梅;肖清;;基于前缀树结构的空间co-location模式挖掘算法研究[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
3 李盛恩;李翠平;王珊;杨婧;;一种XML立方体[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
4 孟军;姜军晓;刘秋水;;基于滑动窗口的流数据频繁模式挖掘算法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
5 周常恩;谢伙生;白清源;谢丽聪;张莹;;挖掘邻近序列模式的一个高效算法[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
6 李帆;夏士雄;张磊;王志愿;;基于语义划分的多层关联规则冗余处理方法[A];2010年全国开放式分布与并行计算机学术会议论文集[C];2010年
7 印莹;张斌;赵宇海;张明卫;张晓红;;多显型疾病中致病模式和保护模式的挖掘[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
8 牛永芬;谢小权;;基于协议解码及模式匹配的网络安全监管技术研究[A];第十七次全国计算机安全学术交流会暨电子政务安全研讨会论文集[C];2002年
9 陈波;董鹏;邵勇;;基于Apriori算法及其改进算法综述[A];中国通信学会第五届学术年会论文集[C];2008年
10 朱永泰;王晨;洪铭胜;汪卫;施伯乐;;ESPM——频繁子树挖掘算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
中国博士学位论文全文数据库 前10条
1 孙琼;下一代互联网的报文标识与查找技术的研究[D];北京邮电大学;2010年
2 毛宇星;关联规则挖掘在分类数据领域的扩展性研究[D];复旦大学;2010年
3 刘志辉;可信域间路由系统关键技术的研究[D];北京邮电大学;2011年
4 刘维;生物序列模式挖掘与识别算法的研究[D];南京航空航天大学;2010年
5 由育阳;数据流容错挖掘算法研究[D];哈尔滨工程大学;2011年
6 周明;基于数据挖掘的制造业采购DSS理论及方法研究[D];天津大学;2009年
7 李海波;频繁子结构挖掘算法研究与应用[D];华中科技大学;2011年
8 陈中育;基于场景的系统行为建模和组合研究[D];上海大学;2011年
9 毛伊敏;数据流频繁模式挖掘关键算法及其应用研究[D];中南大学;2011年
10 朱辉生;基于情节规则匹配的数据流预测研究[D];复旦大学;2011年
中国硕士学位论文全文数据库 前10条
1 董圆;基于前缀树的并行序列模式挖掘算法研究[D];燕山大学;2011年
2 黄安杰;Bicluster数据分析软件设计与实现[D];中山大学;2011年
3 李辉;数据流上的频繁项集挖掘算法研究[D];北京交通大学;2007年
4 何玉;基于核心词扩展的文本分类[D];华中科技大学;2006年
5 李健;面向语义Web服务的发现机制研究[D];北京邮电大学;2009年
6 秦逞;基于前缀树Tire的关联规则挖掘算法研究[D];北京交通大学;2011年
7 崔毓菁;语音识别系统速度优化算法研究[D];北京邮电大学;2008年
8 鲁丽美;基于降维的IPv6包分类算法的设计与实现[D];北京邮电大学;2010年
9 吴楠;有向图子图同构计算算法研究[D];辽宁大学;2012年
10 周小驹;基于流标签的IPv6包分类算法研究[D];北京邮电大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978