收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于存储压缩的多模式串匹配算法

郭莉  刘燕兵  谭建龙  
【摘要】:存储空间的大小和cache的性能是影响串匹配算法速度的关键因素之一。随着关键词规模的扩大,巨大的存储开销导致现有的串匹配算法性能大幅度下降。本文提出了一种节约存储空间的串匹配算法,它以suffixtrie和双数组trie作为识别关键词子串的数据结构,既压缩了存储空间,又保持了快速的访问速度。该算法比较适合于关键词规模为10,000-20,000的应用环境。在15,000关键词规模的随机测试环境下,该算法的存储空间分别为BOM和Aho-Corasick算法的17.6%和18.1%,匹配速度分别为BOM和Aho-Corasick算法的2.5倍和3.8倍。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 庞善臣;基于前缀的BM串匹配改进算法[J];山东科技大学学报(自然科学版);2004年03期
2 庞善臣,王淑栋,蒋昌俊;BM串匹配的一个改进算法[J];计算机应用;2004年12期
3 刘萍,谭建龙;XML内容筛选中的快速串匹配算法[J];中文信息学报;2005年02期
4 陶霖;文本自动校核的一种算法[J];计算机工程;1998年01期
5 朱素英;李芝成;;KMP模式匹配算法探讨[J];计算机与信息技术;2007年05期
6 余霞,辜嘉,舒华忠;一种基于链码的三维心血管图像匹配算法[J];中国图象图形学报;2004年07期
7 苗兰芳,杨传斌;模糊串匹配算法及其应用[J];小型微型计算机系统;1996年10期
8 姚立红 ,訾小超 ,张绍莲 ,谢立;一种高效的多目标串匹配算法[J];计算机应用与软件;2004年01期
9 逯洋;;求任意两个字符串的最大匹配子串及其长度的算法设计[J];科技广场;2007年03期
10 陈倩;;一种基于有限自动机的快速串匹配算法[J];计算机技术与发展;2009年01期
11 何建强;对KARP-RABIN串匹配随机算法的改进[J];广西科学院学报;2002年04期
12 李雪梅,代六玲,童新海,李莉;一种串匹配的快速Boyer-Moore算法[J];计算机应用研究;2005年09期
13 李雪梅;代六玲;童新海;王雄;;对QS串匹配算法的一种改进[J];计算机应用与软件;2006年03期
14 逯洋;李媛媛;;应用于考试系统的字符串匹配度算法的设计[J];吉林省教育学院学报;2007年07期
15 欧嵬;吴纯青;;几种字符串匹配算法的分析和比较[J];微处理机;2007年04期
16 庞善臣,王淑栋;一种基于模式最长前缀正文分割的串匹配新算法[J];小型微型计算机系统;2004年03期
17 刘萍,谭建龙,沙瀛;针对垃圾邮件的直接多关键词匹配算法[J];计算机工程;2005年13期
18 刘燕兵;谭建龙;郭莉;;可动态增删关键词的串匹配算法[J];计算机工程与应用;2005年35期
19 张凯兵;;基于编辑距离的手写数字Freeman链码匹配算法[J];孝感学院学报;2009年06期
20 姜晓彤;;基于链码匹配技术的断层间复杂轮廓线三角曲面重建方法(英文)[J];Journal of Southeast University;2005年04期
中国重要会议论文全文数据库 前4条
1 郭莉;刘燕兵;谭建龙;;基于存储压缩的多模式串匹配算法[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
2 杜云峰;许娜;孙爽;许立永;董彦荣;;一种基于排除的串匹配算法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
3 刘萍;谭建龙;;XML内容筛选中的快速串匹配算法[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
4 张锐;熊赟;陈越;朱扬勇;;MS-BioSM:一个基于多支持度生物序列模式挖掘算法[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
中国博士学位论文全文数据库 前1条
1 全中华;基于动态手写签名的身份认证研究[D];中国科学技术大学;2007年
中国硕士学位论文全文数据库 前10条
1 李国华;基于字符信息量法则的串匹配算法研究[D];郑州大学;2012年
2 王志国;基于连续r位匹配规则的并行串匹配研究[D];太原理工大学;2007年
3 王冠;Java代码相似性判定方法的研究[D];北京工业大学;2008年
4 周江涛;高效精确字符串匹配算法的研究与实现[D];哈尔滨工业大学;2008年
5 张利香;基于后缀数组的字符串模式查找的算法[D];西北师范大学;2010年
6 洪小丽;基于位并行技术的带通配符约束的模式匹配问题研究[D];合肥工业大学;2010年
7 伍添秀;大容量信息隐藏算法研究[D];广西师范大学;2011年
8 张淑梅;词典与后缀数组相结合的中文分词[D];吉林大学;2006年
9 林声;可比语料中命名实体翻译等价对抽取方法研究[D];大连理工大学;2009年
10 冯元勇;智能搜索器的概念库设计及其文档评价策略[D];中南大学;2002年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978