收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于聚簇的XML文档近似连接方法

韩哲  王宏志  高宏  李建中  骆吉洲  
【摘要】:XML文档近似连接操作是在两个XML文档集合中发现近似的XML文档,其在基于XML数据的信息集成、XML数据清洗等系统中有着广泛的应用.然而,目前XML文档近似连接操作的一个显著问题在于:当文档之间存在较大差异时,存在大量的重复计算,降低了处理效率.对于这个问题,提出了基于聚类的XML文档近似连接方法,基本思想是为每个XML文档建立一个索引,如果两个数据集中若干文档的索引较相似,可以把它们组成一簇,然后在每一簇中执行近似连接.而不在任何簇中的文档,则无需对其进行任何计算.实验结果表明,提出的方法在保证正确率的前提下具有高效性.

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 马欢;;XML在电子商务中的应用[J];China's Foreign Trade;2011年14期
2 李恒;;元数据管理系统的研究与实现[J];电脑知识与技术;2011年13期
3 谢峰;;双XML模式在异构数据交换中的应用研究[J];黑龙江科技信息;2011年21期
4 顾锦江;;基于AS技术的计算机网络虚拟实验的开发[J];计算机应用与软件;2011年07期
5 周强;;XML在动态网页中的应用[J];科技传播;2011年15期
6 周长敏;唐型基;;XML技术在考试系统中的应用研究[J];电脑知识与技术;2011年23期
7 陈爱华;;基于XML和Web Service的异构数据库数据交换[J];武汉船舶职业技术学院学报;2011年04期
8 黎娜;张庆吉;;移动数据库同步技术及其应用[J];现代计算机(专业版);2011年10期
9 刘智琦;徐奕奕;;XML在电子商务中的应用[J];黑龙江科技信息;2011年20期
10 朱兴统;许波;;一种基于粗糙集理论的XML数据挖掘模型[J];科学技术与工程;2011年20期
11 张宗平;张咏;秦慧;;基于Web Services的数据交换平台的应用研究[J];现代计算机;2011年07期
12 李传良;;XML数据访问与数据传输优化[J];科学之友;2011年16期
13 朱兴统;;基于DOM的XML文档到关系数据库的数据转换方法[J];电脑知识与技术;2011年13期
14 曹风华;;比较分析XML与HTML[J];电脑与信息技术;2011年04期
15 晏立;沈锐;;Java序列化技术的探讨[J];红河学院学报;2011年04期
16 查文利;;基于XML的教学课件系统设计和实现[J];硅谷;2011年13期
17 兰慧红;邓欢;;基于XML的网络课件动态目录树的设计与实现[J];广西教育学院学报;2011年03期
18 纪宏伟;;基于MathML的WEB数学公式实现[J];科技经济市场;2011年07期
19 庄青青;;XML技术在数字图书馆跨库检索中的应用[J];情报探索;2011年07期
20 钱同海;彭显刚;焦悦东;;基于Web数据挖掘的节电降耗实时分析系统设计[J];电力科学与工程;2011年08期
中国重要会议论文全文数据库 前10条
1 韩哲;王宏志;高宏;李建中;骆吉洲;;基于聚簇的XML文档近似连接方法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
2 郭志懋;周傲英;;XML数据的在线过滤[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
3 何震瀛;李建中;王宏志;;XML数据的关系存储[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
4 丁峰;王煜;姚延涛;沈钧毅;;从XML模式到数据库模式[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
5 谈子敬;施伯乐;;XML导出数据库表的实现与应用[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
6 罗道峰;孟小峰;;一种面向XML文档的基于角色的扩展访问控制方法[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
7 郑骏;王焱;钱卫宁;周傲英;;XML相似相关结构库的构造及其应用[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
8 吴刚;于亚新;王国仁;于戈;;并行XML文档数据分片技术研究[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
9 王静;孟小峰;王珊;;以目标节点为导向的XML路径查询处理[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
10 王鹏飞;洪晓光;;基于XML大文档的动态索引[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
中国博士学位论文全文数据库 前10条
1 沈洁;基于自动机的XML数据过滤研究[D];哈尔滨工程大学;2010年
2 叶晓峰;基于XML的冲压模具设计知识重用技术研究[D];华中科技大学;2010年
3 殷丽凤;不完全信息环境下XML数据库规范化问题的研究[D];哈尔滨理工大学;2009年
4 张晨静;XML关键字过滤技术[D];复旦大学;2011年
5 胡文生;XML数据流上基于窗口的查询处理方法研究[D];武汉大学;2012年
6 宁博;XML查询模式匹配及文档过滤技术研究[D];东北大学;2009年
7 汪源;XML事务模型及并发控制研究[D];浙江大学;2006年
8 许建军;对结构化和半结构化数据的关键字搜索研究[D];复旦大学;2007年
9 刘喜平;XML文档搜索中的查询处理技术研究[D];江西财经大学;2010年
10 李荷华;面向智能体的化工过程运行系统信息集成模型研究[D];华南理工大学;2003年
中国硕士学位论文全文数据库 前10条
1 朱杰;基于主题和结构的XML网页的数据抽取[D];华侨大学;2005年
2 刘靖超;面向数据采集的信息集成系统设计与实现[D];河北工业大学;2005年
3 王旭磊;基于CBR的电子商务网站智能设计系统的研究[D];青岛大学;2005年
4 李志明;基于Web服务的在线考试系统应用研究与实现[D];广东工业大学;2005年
5 江静;基于XML的公文管理系统设计与应用研究[D];南京理工大学;2005年
6 陈美云;基于XML的柔性信息集成技术研究[D];山东科技大学;2005年
7 朱瑜;工作流引擎研究与实现[D];电子科技大学;2005年
8 谢红;XML技术和B/S模式在职业教育与培训管理信息系统中的应用研究[D];重庆大学;2005年
9 郦金花;基于XML的MARC发布系统的设计与实现[D];苏州大学;2005年
10 沈剑沧;XML查询方法研究[D];华东师范大学;2006年
中国重要报纸全文数据库 前10条
1 秦林;《XML完全探索》[N];中华读书报;2001年
2 本报记者 李瀛寰;XML推了网络一把[N];中国计算机报;2000年
3 ;分化并不能阻止XML发展[N];中国计算机报;2000年
4 ;为XML标准定标准[N];中国计算机报;2001年
5 IDG电讯;Microsoft、IBM共同制定XML标准[N];计算机世界;2000年
6 北京邮电大学 张剑;XML与HTML的结合(上)[N];计算机世界;2001年
7 本报记者 陆 杰;XML丛林的新秀[N];中华读书报;2002年
8 四川 杨虹;远距离无绳电话机与普通电话机的连接方法[N];电子报;2001年
9 北京邮电大学 张剑;XML与HTML的结合(下)[N];计算机世界;2001年
10 侯青;国际电子商务XML/EDI特点及现状[N];国际商报;2001年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978