收藏本站
《第二十三届中国数据库学术会议论文集(研究报告篇)》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

一种改进的XML向量空间模型及其近似匹配算法

王桐  刘大昕  田迪  孙伟  张万松  
【摘要】:XML已成为网上数据交换和存储的标准,然而现有的XML文档模型存在很多问题.综合了数据挖掘和信息检索两方面的技术,对传统的向量空间模型加以扩展,提出一种新的基于语义和支持度的XML向量空间模型并给出其生成算法,该模型抽取文档集的频繁路径作为特征,然后利用XML本身的语义特性,对标签之间作ontology判断.最后,基于该模型提出一种XML近似查询算法,将文档矩阵从改进的VSM空间映射到潜在语义空间,并在转换后的空间获得近似查询结果并排序.对提出的方法进行理论分析和实验验证,得到满意的结果.

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 郭炜强;戴天;文贵华;;基于领域知识的专利自动分类[J];计算机工程;2005年23期
2 马辉民;李卫华;吴良元;;VSM在中文文本聚类中的应用及实证分析[J];武汉理工大学学报(信息与管理工程版);2006年04期
3 张娜;张化祥;;基于超链接和内容相关度的检索算法[J];计算机应用;2006年05期
4 杨丽华;戴齐;郭艳军;;KNN文本分类算法研究[J];微计算机信息;2006年21期
5 周文霞;;现代文本分类技术研究[J];武警学院学报;2007年12期
6 朱宗乾;姬浩;杨冬民;;基于网络的ERP实施风险评价信息挖掘模型[J];计算机工程;2008年07期
7 曹建芳;王鸿斌;;基于SVM的汉语动词短语分类算法研究[J];河北北方学院学报(自然科学版);2008年02期
8 徐文海;温有奎;;一种基于TFIDF方法的中文关键词抽取算法[J];情报理论与实践;2008年02期
9 卓佳;张俊坤;李畅;;使用向量空间模型进行信息检索的实现[J];华南金融电脑;2008年10期
10 周军;;基于Web挖掘的站内搜索优化设计[J];南通航运职业技术学院学报;2009年03期
11 杜暖男;马莹莹;;搜索引擎中信息检索模型的研究[J];内江科技;2009年11期
12 陶秋香;喻金科;涂继亮;;基于向量空间模型的公文分类系统研究与实现[J];南昌航空大学学报(自然科学版);2009年04期
13 张亦辉;石冰;李新;;基于向量空间模型的中文文档预处理系统设计[J];山东科学;2010年05期
14 盛秋艳;何文广;;一种改进的向量空间降维方法[J];黑龙江工程学院学报(自然科学版);2011年01期
15 游荣彦,邓志才,李传宏;向量空间模型中特征词的区分度的定量研究[J];中文信息学报;2002年03期
16 周必水,郦泓;用Java实现基于向量空间的搜索引擎优化[J];计算机应用研究;2003年02期
17 陈治纲,何丕廉,孙越恒,郑小慎;基于向量空间模型的文本分类方法的研究与实现[J];计算机应用;2004年S1期
18 成奋华;吴家强;;数字图书馆中基于向量空间模型的文档分类系统[J];上海高校图书情报工作研究;2004年02期
19 田正军;张鸿彦;;文档分类器的研究与实现[J];测绘通报;2005年12期
20 李雪峰;刘鲁;张曌;;基于向量空间模型的在线拍卖商品推荐[J];辽宁工程技术大学学报;2006年02期
中国重要会议论文全文数据库 前10条
1 王桐;刘大昕;田迪;孙伟;张万松;;一种改进的XML向量空间模型及其近似匹配算法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
2 于士涛;袁晓洁;师建兴;杨娜;;一种Web问答系统中基于XML片段的语义项模型[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
3 杨建武;陈晓鸥;;XML文档集的聚类研究[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
4 江腾蛟;万常选;;基于答案结点的XML文档模糊检索排序模型[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
5 郑仕辉;何奇;张龙;梁宇奇;周傲英;;XML文档的相似测度研究[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
6 郭志懋;周傲英;;XML数据的在线过滤[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
7 何震瀛;李建中;王宏志;;XML数据的关系存储[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
8 丁峰;王煜;姚延涛;沈钧毅;;从XML模式到数据库模式[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
9 谈子敬;施伯乐;;XML导出数据库表的实现与应用[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
10 罗道峰;孟小峰;;一种面向XML文档的基于角色的扩展访问控制方法[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
中国重要报纸全文数据库 前10条
1 清华大学计算机系智能技术与系统国家重点实验室 张敏 金奕江;寻“宝”有术[N];计算机世界;2003年
2 北京邮电大学 张剑;XML技术预览[N];计算机世界;2001年
3 湖北 张海;编程日日帖[N];电脑报;2005年
4 北京邮电大学 张剑;XML技术入门[N];计算机世界;2001年
5 孤独笑 乌咪;打造你的音乐万年历(上)[N];电脑报;2003年
6 杭州商学院 徐建平;使用ASP访问XML文件[N];计算机世界;2001年
7 方正技术研究院XML中国论坛网(www.xml.net.cn 董欣;XML的语法[N];网络世界;2000年
8 广东 麦国恒;浅谈应用程序XP风格的实现[N];电脑报;2003年
9 高传聪;让VB程序支持Windows XP界面特效[N];电脑报;2002年
10 湖北 冰人;Dreamweaver实用技巧大放送[N];电脑报;2001年
中国博士学位论文全文数据库 前10条
1 梁作鹏;面向Web的XML检索关键技术研究[D];东南大学;2005年
2 郭永明;XML文档交互式信息检索技术研究[D];东华大学;2010年
3 沈洁;基于自动机的XML数据过滤研究[D];哈尔滨工程大学;2010年
4 叶晓峰;基于XML的冲压模具设计知识重用技术研究[D];华中科技大学;2010年
5 殷丽凤;不完全信息环境下XML数据库规范化问题的研究[D];哈尔滨理工大学;2009年
6 张晨静;XML关键字过滤技术[D];复旦大学;2011年
7 宁博;XML查询模式匹配及文档过滤技术研究[D];东北大学;2009年
8 孙道军;文本挖掘预处理相关基础技术分析与应用研究[D];北京邮电大学;2008年
9 汪源;XML事务模型及并发控制研究[D];浙江大学;2006年
10 马晖男;信息检索中浅层语义模型的研究[D];大连理工大学;2007年
中国硕士学位论文全文数据库 前10条
1 李丽娟;XML文档结构相似度研究及在文档聚类中应用[D];山东大学;2007年
2 姚继伟;基于XML的Web文本挖掘的研究[D];吉林大学;2010年
3 褚金正;面向特定领域的文本识别和分类[D];湖南大学;2005年
4 张波;个性化Web搜索系统研究[D];燕山大学;2006年
5 郭妍;基于市长公开电话文本为背景的两种自动分类算法的比较[D];东北师范大学;2006年
6 董梅;文本内容的信息过滤技术研究[D];合肥工业大学;2006年
7 李洋;企业注册登记文件聚类软件设计与实现[D];大连理工大学;2007年
8 吴新涛;基于向量空间模型的网页信息过滤方法研究[D];大连理工大学;2008年
9 赵博;一种基于关键向量的文本分类模型的研究[D];哈尔滨理工大学;2008年
10 赵文鹏;基于自组织特征映射的海洋文献聚类分析的研究与实现[D];中国海洋大学;2009年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978