收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

支持块编辑距离的索引结构

王斌  郭庆  李中博  杨晓春  
【摘要】:在近似字符串匹配中,传统的编辑距离不能很好地衡量诸如人名、地址等数据的相似关系,而块编辑距离可以很好地衡量两个字符串的相似性。如何有效的支持块编辑距离,进行近似字符串查询处理具有重要的意义。计算两个字符串的块编辑距离是一个NP完全问题,因此希望从数据集中过滤掉尽可能多的不是答案的字符串。首先给出支持子串移动编辑距离的一个下界,并基于此提出一种新颖的索引结构SHV-trie。为了减少SHV-trie的空间开销,又提出基于调整字符排列顺序的优化策略和SHV-trie的一种压缩索引结构CST。真实数据集上的实验结果与分析显示了所提出的索引结构具有良好的过滤能力和效率。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 高雪霞;邝涛;;基于词典知识库的快速检索算法研究[J];德州学院学报;2011年04期
2 郑家彬;蒋夏军;;移动对象XML数据库的存储与索引[J];计算机工程与应用;2011年20期
3 赵艳梅;郑鑫福;徐立臻;;内存数据库系统SwiftMMDB索引机制的设计与实现[J];计算机应用;2011年09期
4 刘洪磊;杨晓春;王斌;金蓉;;支持局部最优化匹配的近似子串查询算法[J];计算机科学与探索;2011年09期
5 王健;哈力木拉提·买买提;;印刷体维吾尔文识别后处理[J];新疆大学学报(自然科学版);2011年02期
6 吴烨;熊伟;蔡蕾;景宁;;面向多核处理器的空间数据库索引性能分析[J];计算机科学与探索;2011年08期
7 刘艳;郝忠孝;;高维主存kNN连接索引结构的核心算法[J];计算机科学;2011年09期
8 李雯;夏士雄;张磊;;VR-tree索引结构的轨迹Stop区域快速发现[J];微电子学与计算机;2011年08期
9 李成云;支冬栋;;免疫算法在入侵检测模型中的应用研究[J];电脑知识与技术;2011年19期
10 邹志文;费洪哲;李根;;基于聚类的空间数据多比例尺索引树[J];计算机工程;2011年14期
11 徐红波;郝忠孝;;基于B~Z树深度优先高维空间范围查询算法[J];高技术通讯;2010年08期
12 吐尔洪·吾司曼;维尼拉·木沙江;;维、哈、柯多语种搜索引擎中索引器的研究[J];新疆大学学报(自然科学版);2011年02期
13 章文涛;吴玲琦;;存储遥感影像的一种多层AVL tree结构[J];计算机系统应用;2011年08期
14 张敏;;信息抽取技术在网页中的应用[J];中国城市经济;2011年20期
15 徐强;孙乐昌;刘京菊;赵亭;蔡铭;;DHT网络中的多维复杂查询处理方法研究[J];计算机科学;2011年09期
16 郭敏;张卫强;刘加;;一种基于帧-音符方式的哼唱检索算法[J];清华大学学报(自然科学版);2011年04期
17 公帅;熊锦华;刘志勇;;最终用户编程中的业务流程相似度计算[J];计算机集成制造系统;2011年08期
18 王新华;;网络版多功能现代汉字辞典的设计和实现[J];微计算机信息;2011年08期
19 王攀;李思昆;蔡勋;曾亮;;栅格划分的二叉区间树节点构造算法[J];计算机辅助设计与图形学学报;2011年07期
20 李鹤;侯海翔;姜跃;廖小飞;金海;;面向多虚拟机的分布式存储系统[J];计算机科学与探索;2011年07期
中国重要会议论文全文数据库 前10条
1 王斌;郭庆;李中博;杨晓春;;支持块编辑距离的索引结构[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
2 朱永泰;王晨;汪卫;施伯乐;;高效的图索引结构[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
3 曹奎;冯玉才;袁芳;;一种支持基于内容的图像检索的多维索引结构[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
4 许俭;吴天轶;王晨;汪卫;施伯乐;;聚集值近似查询的基于密度树索引结构(英文)[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
5 张龙;周傲英;郑仕辉;梁宇奇;;一种可行的层次型XML仓库索引结构[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
6 李东;张静玲;王亮明;;一种XML集成索引结构[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
7 汪卫;王勇;王宇君;施伯乐;;一维动态区间索引结构[A];数据库研究进展97——第十四届全国数据库学术会议论文集(上)[C];1997年
8 丁道峰;吴红伟;王晓玲;周傲英;;D(k,l)-索引:一种自适应的XML数据索引[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
9 张恩德;王国仁;宁博;王斌;;DVBB:基于Dewey向量的B+树索引结构连接算法(英文)[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
10 张林;王国仁;于戈;;XSR-tree:一种高维数据空间中的索引结构[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
中国博士学位论文全文数据库 前10条
1 戴东波;序列数据的相似性查询研究[D];复旦大学;2009年
2 张泽宝;空间数据库的索引技术研究[D];哈尔滨工程大学;2009年
3 董道国;高维数据索引结构研究[D];复旦大学;2005年
4 王洁;汉语中介语偏误的计算机处理方法研究[D];北京语言大学;2008年
5 闫莺;多数据类型的数据流查询处理及优化[D];复旦大学;2008年
6 阳国贵;对象关系数据库中若干关键技术的研究[D];中国人民解放军国防科学技术大学;2000年
7 雷向欣;XML索引和过滤查询若干关键技术研究[D];复旦大学;2005年
8 刘良旭;移动对象数据库中时空数据管理若干关键技术研究[D];东华大学;2008年
9 苏亮;数据流分析关键技术研究[D];国防科学技术大学;2008年
10 程起敏;基于内容的遥感影像库检索关键技术研究[D];中国科学院研究生院(遥感应用研究所);2004年
中国硕士学位论文全文数据库 前10条
1 孙冬璞;基于时空数据库的轨迹最近邻索引的研究[D];哈尔滨理工大学;2007年
2 邱伯仁;生物序列的索引研究及其应用[D];复旦大学;2009年
3 陈波;XML文档数据查询技术研究[D];山东大学;2005年
4 林恩爱;基于聚类的分层索引结构在图像检索中的应用研究[D];北京交通大学;2006年
5 钟细亚;时空数据库索引技术研究[D];华中科技大学;2006年
6 朱清华;支持XML数据更新的编码方案与索引技术研究[D];湖南师范大学;2009年
7 黄影;生物序列索引结构构造算法研究[D];西安电子科技大学;2009年
8 张明;基于索引结构的代谢网络比对算法研究[D];西安电子科技大学;2010年
9 卢超;时空数据存储与索引结构的设计与实现[D];华中科技大学;2004年
10 和彦莉;基于图编辑距离的画像识别[D];西安电子科技大学;2010年
中国重要报纸全文数据库 前9条
1 沈建苗 编译;实现多重标准搜索[N];计算机世界;2006年
2 ;智能管理 永远可用[N];网络世界;2004年
3 庞引明;XML数据库:最新进展和发展方向[N];计算机世界;2004年
4 ;整合信息资源 提升竞争活力[N];计算机世界;2005年
5 ;挖掘商业价值 驱动企业成功[N];计算机世界;2005年
6 SYBASE中国公司商务智能顾问 魏建;面向Web的智能商务解决方案[N];中国计算机报;2003年
7 四川 张悦;优化SQL Server的索引[N];电脑报;2004年
8 马如桂;信息化管理从软件开始[N];中国保险报;2000年
9 ;Adobe Reader 7.0简体中文版向我们走来[N];中国电脑教育报;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978