收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

一种挖掘压缩序列模式的有效算法

童咏昕  张媛媛  袁玫  马世龙  于丹  赵莉  
【摘要】:从序列数据库中挖掘频繁序列模式是数据挖掘领域的一个中心研究主题,而且该领域已经提出和研究了各种有效的序列模式挖掘算法。由于在挖掘过程中会产生大量的频繁序列模式,最近许多研究者已经不再聚焦于序列模式挖掘算法的效率,而更关注于如何让用户更容易地理解序列模式的结果集。本文受到压缩频繁项集思想的启发,提出了一种CFSP(CompressingFrequent Sequential Patterns)算法,其可挖掘出少量的有代表性的序列模式来表达全部频繁序列模式的信息,并且清除了大量的冗余序列模式。CFSP是一种two-steps的算法:在第一步,其获得了全部闭序列模式作为有代表性序列模式的候选集,与此同时还得到大多数的有代表性模式;在第二步,该算法只花费了少量的时间去发现剩余的有代表性序列模式.一个采用真实数据集与模拟数据集的实验研究也证明了CFSP算法具有高效性.

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 阳小兰;钱程;赵海廷;;Web日志分析系统研究[J];计算机技术与发展;2011年09期
2 张长海;胡孔法;陈崚;宋爱波;;一种高效的基于位图序列模式挖掘算法[J];高技术通讯;2010年02期
3 朱红;陈星霖;;基于数据挖掘的网上证券交易异常行为分析[J];计算机安全;2011年08期
4 林颖;;闭合序列模式的一种增量挖掘算法[J];重庆理工大学学报(自然科学);2011年06期
5 黄晓斌;谭颖骞;;网络信息挖掘方法的效果评价[J];情报理论与实践;2011年06期
6 黄钧钧;谢伙生;;数据流中基于滑动窗口的闭序列模式挖掘算法[J];计算机工程与设计;2011年06期
7 李广原;杨炳儒;刘永彬;刘英华;;多维序列模式挖掘算法[J];计算机工程与设计;2011年07期
8 李杨;檀柏红;;基于点击流的频繁模式聚类算法研究[J];天津科技大学学报;2011年03期
9 刘秀敏;刘秀娟;王国明;周立波;;基于Web挖掘的个性化教学推荐系统[J];计算机时代;2011年07期
10 陈春颖;熊拥军;;基于序列模式挖掘的读者借阅行为分析[J];图书情报知识;2011年04期
11 殷凤霞;;基于知识转移的商品推荐研究[J];安康学院学报;2011年03期
12 宋威;刘文博;李晋宏;;基于动态裁剪频繁模式树的频繁项集并发挖掘算法[J];山东大学学报(工学版);2011年04期
13 ;[J];;年期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 童咏昕;张媛媛;袁玫;马世龙;于丹;赵莉;;一种挖掘压缩序列模式的有效算法[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
2 张琪;朱秋云;朱绍文;姬朝阳;魏苑琦;陈亮;;对一种序列模式的增量式算法的改进[A];2005年中国智能自动化会议论文集[C];2005年
3 丁祥武;;序列模式的可信度[A];第十六届全国数据库学术会议论文集[C];1999年
4 周常恩;谢伙生;白清源;谢丽聪;张莹;;挖掘邻近序列模式的一个高效算法[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
5 朱扬勇;郭德培;施伯乐;;数据库中序列模式的增量数据采矿技术[A];数据库研究进展97——第十四届全国数据库学术会议论文集(上)[C];1997年
6 程银波;司菁菁;;带有间隔约束的序列模式挖掘算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
7 姚伟力;王锡禄;宋俊德;;基于序列模式挖掘的告警相关性分析算法[A];2005年信息与通信领域博士后学术会议论文集[C];2005年
8 何星星;谢伙生;;流数据中一种高效剪枝的频繁序列挖掘算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
9 黄东;唐俊;汪卫;施伯乐;;CuMen:基于最大频繁序列模式的聚类算法及其在基因拼接中的应用[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
10 于大东;刘东波;罗睿;王建新;;状态序列时态关联挖掘[A];促进企业信息化进程——第九届中国Java技术及应用交流大会文集[C];2006年
中国博士学位论文全文数据库 前10条
1 汤春蕾;交易序列数据挖掘研究[D];复旦大学;2011年
2 佘春东;数据挖掘算法分析及其并行模式研究[D];电子科技大学;2004年
3 徐敏;基于数据挖掘的Web信息检索研究[D];南京航空航天大学;2006年
4 张榛楠;面向电子商务的Web使用挖掘关键技术研究[D];中国矿业大学(北京);2009年
5 佟强;科学数据网格中数据挖掘技术研究[D];中国科学院研究生院(计算技术研究所);2006年
6 荆涛;面向领域网页的语义标注若干问题研究[D];吉林大学;2011年
7 林冠洲;网络流量识别关键技术研究[D];北京邮电大学;2011年
8 郑家顺;转录因子结合位点和组合调控模式的研究[D];清华大学;2005年
9 肖敏;基于可拓学的网络安全管理相关技术[D];华中师范大学;2008年
10 宋卫林;基于最大频繁项目集的数据挖掘关联规则算法研究[D];北京邮电大学;2006年
中国硕士学位论文全文数据库 前10条
1 杨天霞;基于序列模式的序列聚类挖掘算法研究[D];西北师范大学;2010年
2 孟霞;泛在网络中情景感知业务的实现及用户移动序列模式研究[D];北京邮电大学;2010年
3 王晓雪;基于Web日志的序列模式挖掘算法的研究[D];东北师范大学;2010年
4 李明月;基于约束的闭序列模式挖掘算法的研究[D];燕山大学;2012年
5 金灿;序列模式的增量式挖掘算法研究[D];华中师范大学;2004年
6 王鹏;基于位置的社会网络关系判别模型研究[D];北京交通大学;2011年
7 丁哲;迭代闭序列模式挖掘算法及其在软件可信性分析中的应用研究[D];兰州大学;2012年
8 苗东菁;不确定序列模式发现与查询算法的研究[D];哈尔滨工业大学;2011年
9 聂成林;数据库中序列模式发现的研究[D];合肥工业大学;2003年
10 公伟;序列模式挖掘算法及其在云取证中的应用研究[D];山东师范大学;2012年
中国重要报纸全文数据库 前4条
1 蔡建生;跨国公司为什么会“出事”?[N];中国经营报;2004年
2 邬建荣;上海双菱“智能”集中客户数据[N];计算机世界;2004年
3 ;智能决策为企业导航[N];计算机世界;2001年
4 张立明;数据挖掘之道[N];网络世界;2003年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978