收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

XML内容筛选中的快速串匹配算法

刘萍  谭建龙  
【摘要】:本文提出了一种对XML 文本进行快速串匹配的算法—XMatch。在对于XML 文本的含路径信息的模式串匹配中,由于XML 文本的结构化特点,使得传统的串匹配算法不能直接有效的使用;而现有的大部分XML 内容筛选方法都是基于SAX 分析的事件驱动过程,效率普遍较低。XMatch 在对XML 文本的结构—schema 进行分析的同时,结合模式串的路径信息,建立一个扫描自动机的有限状态自动机:此外,算法还支持带循环引用路径信息的模式串匹配。XMatch 容易扩展,可以支持普通的结构化文本的串匹配。实验结果显示,本算法的效率比使用SAX 事件驱动的方法有明显的提高。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 孙钟秀,张德富;简评《并行算法的设计与分析》[J];教学与教材研究;1995年02期
2 孙广路;郎非;杨明明;;基于混合方法的流量测量系统(英文)[J];电机与控制学报;2011年06期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
11 ;[J];;年期
12 ;[J];;年期
13 ;[J];;年期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 刘萍;谭建龙;;XML内容筛选中的快速串匹配算法[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
2 涂锟;顾乃杰;董万利;;分布存储环境下的基于后缀数组的串匹配算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
3 杜云峰;许娜;孙爽;许立永;董彦荣;;一种基于排除的串匹配算法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
4 贺龙涛;隋杰;;网络内容检测中的串匹配算法实现研究[A];全国网络与信息安全技术研讨会论文集(下册)[C];2007年
5 郭莉;刘燕兵;谭建龙;;基于存储压缩的多模式串匹配算法[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
6 曹京;刘燕兵;刘萍;谭建龙;郭莉;;定序窗口布尔表达式匹配技术研究[A];全国网络与信息安全技术研讨会论文集(下册)[C];2007年
7 张莹莹;段翔;周彬;王晓云;;移动通信网络中的内容安全[A];2007年中国通信学会“移动增值业务与应用”学术年会论文集[C];2007年
8 陈传钩;王新生;任建玲;;一种高效的多模式匹配算法[A];2006年全国理论计算机科学学术年会论文集[C];2006年
9 胡智信;樊生文;刘海山;乔森;;活套式拉丝机张力闭环控制电控系统[A];全国冶金自动化信息网2009年会论文集[C];2009年
10 曾诚;李兵;何克清;;KMP算法在Web服务语义标注中的应用[A];2010年全国开放式分布与并行计算机学术会议论文集[C];2010年
中国博士学位论文全文数据库 前4条
1 全中华;基于动态手写签名的身份认证研究[D];中国科学技术大学;2007年
2 谭建龙;串匹配算法及其在网络内容分析中的应用[D];中国科学院研究生院(计算技术研究所);2003年
3 李相迎;CCSDS数据链路层协议识别关键技术研究[D];中国科学院研究生院(空间科学与应用研究中心);2011年
4 张琳;汉语口语对话系统中口语语言分析[D];上海交通大学;2008年
中国硕士学位论文全文数据库 前10条
1 李国华;基于字符信息量法则的串匹配算法研究[D];郑州大学;2012年
2 章张;基于层次分类的网络内容监管系统中串匹配算法的设计与实现[D];南京理工大学;2004年
3 王志国;基于连续r位匹配规则的并行串匹配研究[D];太原理工大学;2007年
4 王冠;Java代码相似性判定方法的研究[D];北京工业大学;2008年
5 周江涛;高效精确字符串匹配算法的研究与实现[D];哈尔滨工业大学;2008年
6 张利香;基于后缀数组的字符串模式查找的算法[D];西北师范大学;2010年
7 洪小丽;基于位并行技术的带通配符约束的模式匹配问题研究[D];合肥工业大学;2010年
8 刘洋;基于IIS审计的入侵检测系统设计[D];哈尔滨工程大学;2007年
9 范曾;异构机群系统上多目标和多模式近似串匹配并行算法研究[D];广西大学;2008年
10 石磊;秘密比较问题及其应用研究[D];安徽师范大学;2010年
中国重要报纸全文数据库 前4条
1 侯海龙;IntruShield打通IPS瓶颈[N];中国计算机报;2003年
2 本报记者 王翌;“搜索”改变信息获取方式[N];计算机世界;2004年
3 宋春雨;链路层URL智能过滤技术[N];中国计算机报;2002年
4 陈曦 Robinson;绿色过滤技术的是与非[N];电脑报;2009年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978