收藏本站
《NDBC2010第27届中国数据库学术会议论文集(B辑)》2010年
收藏 | 手机打开
二维码
手机客户端打开本文

DWDIS:面向分析的Deep Web数据集成系统

闫中敏  李庆忠  彭朝晖  董永权  丁艳辉  张永新  徐秀星  
【摘要】:传统Deep Web数据集成研究侧重满足用户的即时查询需求,对数据分析应用缺乏充分支持,提出一个面向分析的Deep Web数据集成系统DWDIS,能够在较少人工参与下对大量Web数据库进行高质量数据获取、抽取和整合,为分析型应用提供优质全面的结构化数据.DWDIS支持领域模型的自动演化;通过自动识别和理解查询接口,采用查询词采新率模型以较小代价最大限度地获取Deep Web页面;充分利用集成系统已有数据中隐含的数据特征,对Deep Web页面进行有效页面抽取和语义标注;结合Web数据源特征,使用机器学习方法对来自大量Web数据库的数据实现高准确率的重复记录检测和数据融合.

【相似文献】
中国期刊全文数据库 前10条
1 王进鹏;张亚非;苗壮;;SPARQL查询的关系代数表示与转换方法[J];计算机工程与应用;2011年22期
2 王晓虹;刘莹;张艳凤;;高校数据集成系统的ETL设计与实现[J];计算机技术与发展;2011年07期
3 辛洁;崔志明;赵朋朋;张广铭;鲜学丰;;基于MapReduce虚拟机的Deep Web数据源发现方法[J];通信学报;2011年07期
4 卢菁;朱小栋;彭敦陆;霍欢;;MDUAM:一个企业信息集成系统中元数据更新分析与管理系统[J];小型微型计算机系统;2011年06期
5 卓林;杨舟;岳亮;赵朋朋;崔志明;;Deep Web爬虫的一种增量式更新策略[J];苏州大学学报(工科版);2011年04期
6 李明;李秀兰;;基于结果模式的Deep Web数据标注方法[J];计算机应用;2011年07期
7 杨舟;岳亮;卓林;赵朋朋;崔志明;;一种基于领域本体的Deep Web数据自动标注方法[J];苏州大学学报(工科版);2011年04期
8 邵秀丽;孙杰;侯乐彩;;基于整体模式匹配的深度网集成系统的研究[J];计算机工程与设计;2011年08期
9 董永权;李庆忠;丁艳辉;张永新;;一种基于证据理论和任务分配的Deep Web查询接口匹配方法[J];模式识别与人工智能;2011年02期
10 杨典华;邓磊;袁德阳;尹川;;一种基于本体的多源遥感数据集成系统[J];微计算机信息;2011年08期
中国重要会议论文全文数据库 前10条
1 闫中敏;李庆忠;彭朝晖;董永权;丁艳辉;张永新;徐秀星;;DWDIS:面向分析的Deep Web数据集成系统[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
2 谢丽聪;白清源;余建家;;数据集成系统的三层体系结构及查询改写算法的改进[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
3 陶然;江锦华;吴羽;陈刚;;基于树合并的Deep Web查询接口集成[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
4 肖冰;廖湖声;郑玉明;;数据集成系统中的XML延迟处理技术[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
5 余伟;李石君;洪辉;田建伟;;基于覆盖关系的Deep Web数据源排名[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
6 王上;于海;王钲旋;;Deep Web垂直搜索引擎设计与实现[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
7 ;生产调度数据集成系统[A];中国黄金协会科学技术奖表彰会暨新技术、新设备推广会议材料[C];2004年
8 梁浩;左万利;任斐;赫枫龄;;基于启发式信息的Deep Web查询接口属性抽取[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
9 王英;左万利;王鑫;彭涛;;Deep Web查询转换研究[A];第六届全国信息检索学术会议论文集[C];2010年
10 王英;左万利;王鑫;彭涛;;基于多分类器的Deep Web入口发现[A];第六届全国信息检索学术会议论文集[C];2010年
中国重要报纸全文数据库 前10条
1 周志岐;浅谈银行客户关系管理与客户资源开发[N];中国城乡金融报;2006年
2 ;BI困则思变[N];网络世界;2007年
3 赵文杰 李伟;客户关系管理:实现以客户为中心[N];金融时报;2002年
4 慧丽 严伟 双福;潞城失业保险工作成效显著[N];长治日报;2006年
5 ;阿尔卡特与Verizon携手[N];人民邮电;2006年
6 湘樟;专用是虚规避是实[N];政府采购信息报;2008年
7 本报记者 张建铭;思科:三位一体的统一通信网络[N];网络世界;2003年
8 哈尔滨工业大学 王宏志;借XML高效管理数据之道[N];中国计算机报;2007年
9 李清海;坚持以人为本 维护职工权益[N];中国信息报;2004年
10 本报记者 吴长锋;开掘创新源泉[N];科技日报;2003年
中国博士学位论文全文数据库 前10条
1 闫中敏;Deep Web数据获取问题研究[D];山东大学;2010年
2 田建伟;面向领域的高质量Deep Web数据集成技术研究[D];武汉大学;2010年
3 潘鹏;Deep Web查询中的不确定性问题研究[D];山东大学;2010年
4 王英;Deep Web数据集成关键技术研究[D];吉林大学;2010年
5 陶春;半结构化数据集成系统中的查询处理研究[D];复旦大学;2004年
6 董永权;Deep Web数据集成关键问题研究[D];山东大学;2010年
7 吴春明;Deep Web数据集成关键技术及其在农业领域的应用[D];西南大学;2011年
8 梁浩;Deep Web信息集成架构及相关问题研究[D];吉林大学;2010年
9 张慧斌;Deep Web查询接口及查询结果抽取研究[D];南开大学;2010年
10 陈珂锐;基于本体演化的Deep Web数据抽取与注释[D];吉林大学;2011年
中国硕士学位论文全文数据库 前10条
1 郭军;Deep Web数据集成系统的设计与应用研究[D];西安电子科技大学;2011年
2 阴丽莹;一种Deep Web数据集成系统预取策略的研究[D];哈尔滨工程大学;2011年
3 李秀兰;基于结果模式的Deep Web语义标注研究[D];兰州理工大学;2011年
4 谢莹;Deep Web查询结果抽取及注释[D];吉林大学;2010年
5 陈文;Deep Web入口识别和个性化搜索研究与设计[D];江苏大学;2010年
6 常勇;Deep Web数据集成系统中数据标注研究[D];河北大学;2009年
7 高亚;Deep Web数据集成系统中数据抽取与语义标注研究[D];河北大学;2010年
8 姚增利;基于领域知识的Deep Web接口发现研究[D];河北大学;2009年
9 乔溪;基于XML的数据集成系统的研究与应用[D];北京化工大学;2005年
10 李晶;基于产品生命周期的中小型企业数据集成系统的研究[D];合肥工业大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026