收藏本站
《第二十三届中国数据库学术会议论文集(研究报告篇)》2006年
收藏 | 手机打开
二维码
手机客户端打开本文

一种改进的XML向量空间模型及其近似匹配算法

王桐  刘大昕  田迪  孙伟  张万松  
【摘要】:XML已成为网上数据交换和存储的标准,然而现有的XML文档模型存在很多问题.综合了数据挖掘和信息检索两方面的技术,对传统的向量空间模型加以扩展,提出一种新的基于语义和支持度的XML向量空间模型并给出其生成算法,该模型抽取文档集的频繁路径作为特征,然后利用XML本身的语义特性,对标签之间作ontology判断.最后,基于该模型提出一种XML近似查询算法,将文档矩阵从改进的VSM空间映射到潜在语义空间,并在转换后的空间获得近似查询结果并排序.对提出的方法进行理论分析和实验验证,得到满意的结果.

【参考文献】
中国期刊全文数据库 前1条
1 曹奎,冯玉才;一种压缩域特征提取与语义图像检索技术[J];小型微型计算机系统;2005年01期
【共引文献】
中国期刊全文数据库 前10条
1 刘金红;陆余良;施凡;宋舜宏;;基于语义上下文分析的因特网人物信息挖掘[J];安徽大学学报(自然科学版);2009年04期
2 钟尚平;林静;;一个基于TSVM的GIF图像通用隐写检测方法[J];北京交通大学学报;2009年02期
3 张晓琳,谭跃生,戴华忠;基于规则的XML查询语言研究[J];包头钢铁学院学报;2005年02期
4 李华雄;刘盾;周献中;;决策粗糙集模型研究综述[J];重庆邮电大学学报(自然科学版);2010年05期
5 兰小机,闾国年,刘德儿,张书亮;基于XQuery的GML查询语言研究[J];测绘科学;2005年06期
6 阎红灿;王淑芬;朱晓亮;闫少宏;李敏强;;基于XQuery数据模型的XUL语言的定义和实现[J];东北师大学报(自然科学版);2008年04期
7 韩旭东;;一种基于非等概率更新的XML区间编码方法[J];电大理工;2008年02期
8 刘蓉;;半监督学习的Co-training算法研究[J];电脑编程技巧与维护;2010年14期
9 吴元斌;;单agent强化学习与多agent强化学习比较研究[J];电脑与信息技术;2009年01期
10 吴元斌;;几种agent强化学习方法的比较研究[J];电脑知识与技术;2008年13期
中国重要会议论文全文数据库 前10条
1 蒋全胜;贾民平;胡建中;许飞云;;一种基于流形学习的故障模式识别方法[A];第九届全国振动理论及应用学术会议论文集[C];2007年
2 陆斌;骆志刚;苏光龙;丁凡;;RNA序列结构比对算法综述[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
3 徐云峰;;一种新的取证计算模型的研究与实现[A];第二十一次全国计算机安全学术交流会论文集[C];2006年
4 秦朗;;基于二叉树多层分类SVM的脱机手写体汉字识别[A];第十九届测控、计量、仪器仪表学术年会(MCMI'2009)论文集[C];2009年
5 ;Schema Based Data Storage and Query Optimization for Semi-structured Data[A];Proceedings of the First International Conference on Web-Age Information Management[C];2000年
6 Jong P.Yoon;Vijay Raghavan;;Multi-level Schema Extraction for Heterogeneous Semi-structured Data[A];Proceedings of the First International Conference on Web-Age Information Management[C];2000年
7 张晶;张云生;;基于XML的实时数据一致性查询机制[A];全国炼钢连铸过程自动化技术交流会论文集[C];2006年
8 王天芳;袁世宏;;证候/证候要素研究的分类假说与方法[A];中国中西医结合学会诊断专业委员会2009’年会论文集[C];2009年
9 张德;董逸生;;基于XML的异构数据源集成系统[A];第十六届全国数据库学术会议论文集[C];1999年
10 王钦克;周立柱;;基于模式的半结构化数据重组[A];第十六届全国数据库学术会议论文集[C];1999年
中国博士学位论文全文数据库 前10条
1 梁洪;基于内容的医学图像检索及语义建模关键技术研究[D];哈尔滨工程大学;2010年
2 高山;蛋白质点突变效果预测与突变数据库研究[D];南开大学;2010年
3 蔺旭东;基于语义的XML查询及规范化研究[D];北京交通大学;2010年
4 杨国鹏;基于机器学习方法的高光谱影像分类研究[D];解放军信息工程大学;2010年
5 皋军;智能识别中的降维新方法及其应用研究[D];江南大学;2010年
6 赵永平;支持向量回归机及其在智能航空发动机参数估计中的应用[D];南京航空航天大学;2009年
7 唐伦;支持认知、协作的无线网络资源优化分配[D];重庆大学;2010年
8 汤华茂;基于语义的产业链网络化协同设计模式及关键技术研究[D];重庆大学;2010年
9 刘笑嶂;核方法的若干关键问题研究及其在人脸图像分析中的应用[D];中山大学;2010年
10 徐小双;基于路径概要的XML查询研究[D];华中科技大学;2010年
中国硕士学位论文全文数据库 前10条
1 马冉冉;集成学习算法研究[D];山东科技大学;2010年
2 夏光磊;关于XML的关系数据库存储查询技术研究[D];山东科技大学;2010年
3 左国辉;基于子空间方法的人脸识别技术研究[D];哈尔滨工程大学;2009年
4 杨欣颖;潜器光视觉目标识别技术的研究与设计[D];哈尔滨工程大学;2010年
5 蒋延生;基于图的适应性相似度估算的半监督学习[D];大连理工大学;2010年
6 赵群;极小化标注的音频分类和句子切分的研究[D];中国海洋大学;2010年
7 张丽;无标注自学习反垃圾邮件服务的研究[D];中国海洋大学;2010年
8 夏敬婵;基于结构模态参数和SVM的结构损伤识别研究[D];河南理工大学;2010年
9 范春晓;基于XML的Web信息抽取技术研究[D];沈阳理工大学;2010年
10 郝旭光;白车身装焊误差监控方法及技术的研究[D];沈阳理工大学;2010年
【二级参考文献】
中国期刊全文数据库 前1条
1 曹奎,冯玉才;基于GM模型和Hilbert空间填充曲线的图象压缩方法[J];小型微型计算机系统;2002年11期
【相似文献】
中国期刊全文数据库 前10条
1 郭炜强;戴天;文贵华;;基于领域知识的专利自动分类[J];计算机工程;2005年23期
2 马辉民;李卫华;吴良元;;VSM在中文文本聚类中的应用及实证分析[J];武汉理工大学学报(信息与管理工程版);2006年04期
3 张娜;张化祥;;基于超链接和内容相关度的检索算法[J];计算机应用;2006年05期
4 杨丽华;戴齐;郭艳军;;KNN文本分类算法研究[J];微计算机信息;2006年21期
5 周文霞;;现代文本分类技术研究[J];武警学院学报;2007年12期
6 朱宗乾;姬浩;杨冬民;;基于网络的ERP实施风险评价信息挖掘模型[J];计算机工程;2008年07期
7 曹建芳;王鸿斌;;基于SVM的汉语动词短语分类算法研究[J];河北北方学院学报(自然科学版);2008年02期
8 徐文海;温有奎;;一种基于TFIDF方法的中文关键词抽取算法[J];情报理论与实践;2008年02期
9 卓佳;张俊坤;李畅;;使用向量空间模型进行信息检索的实现[J];华南金融电脑;2008年10期
10 周军;;基于Web挖掘的站内搜索优化设计[J];南通航运职业技术学院学报;2009年03期
中国重要会议论文全文数据库 前10条
1 王桐;刘大昕;田迪;孙伟;张万松;;一种改进的XML向量空间模型及其近似匹配算法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
2 于士涛;袁晓洁;师建兴;杨娜;;一种Web问答系统中基于XML片段的语义项模型[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
3 杨建武;陈晓鸥;;XML文档集的聚类研究[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
4 江腾蛟;万常选;;基于答案结点的XML文档模糊检索排序模型[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
5 郑仕辉;何奇;张龙;梁宇奇;周傲英;;XML文档的相似测度研究[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
6 郭志懋;周傲英;;XML数据的在线过滤[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
7 何震瀛;李建中;王宏志;;XML数据的关系存储[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
8 丁峰;王煜;姚延涛;沈钧毅;;从XML模式到数据库模式[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
9 谈子敬;施伯乐;;XML导出数据库表的实现与应用[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
10 罗道峰;孟小峰;;一种面向XML文档的基于角色的扩展访问控制方法[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
中国重要报纸全文数据库 前10条
1 清华大学计算机系智能技术与系统国家重点实验室 张敏 金奕江;寻“宝”有术[N];计算机世界;2003年
2 北京邮电大学 张剑;XML技术预览[N];计算机世界;2001年
3 湖北 张海;编程日日帖[N];电脑报;2005年
4 北京邮电大学 张剑;XML技术入门[N];计算机世界;2001年
5 孤独笑 乌咪;打造你的音乐万年历(上)[N];电脑报;2003年
6 杭州商学院 徐建平;使用ASP访问XML文件[N];计算机世界;2001年
7 方正技术研究院XML中国论坛网(www.xml.net.cn 董欣;XML的语法[N];网络世界;2000年
8 广东 麦国恒;浅谈应用程序XP风格的实现[N];电脑报;2003年
9 高传聪;让VB程序支持Windows XP界面特效[N];电脑报;2002年
10 湖北 冰人;Dreamweaver实用技巧大放送[N];电脑报;2001年
中国博士学位论文全文数据库 前10条
1 梁作鹏;面向Web的XML检索关键技术研究[D];东南大学;2005年
2 郭永明;XML文档交互式信息检索技术研究[D];东华大学;2010年
3 沈洁;基于自动机的XML数据过滤研究[D];哈尔滨工程大学;2010年
4 叶晓峰;基于XML的冲压模具设计知识重用技术研究[D];华中科技大学;2010年
5 殷丽凤;不完全信息环境下XML数据库规范化问题的研究[D];哈尔滨理工大学;2009年
6 张晨静;XML关键字过滤技术[D];复旦大学;2011年
7 宁博;XML查询模式匹配及文档过滤技术研究[D];东北大学;2009年
8 孙道军;文本挖掘预处理相关基础技术分析与应用研究[D];北京邮电大学;2008年
9 汪源;XML事务模型及并发控制研究[D];浙江大学;2006年
10 马晖男;信息检索中浅层语义模型的研究[D];大连理工大学;2007年
中国硕士学位论文全文数据库 前10条
1 李丽娟;XML文档结构相似度研究及在文档聚类中应用[D];山东大学;2007年
2 姚继伟;基于XML的Web文本挖掘的研究[D];吉林大学;2010年
3 褚金正;面向特定领域的文本识别和分类[D];湖南大学;2005年
4 张波;个性化Web搜索系统研究[D];燕山大学;2006年
5 郭妍;基于市长公开电话文本为背景的两种自动分类算法的比较[D];东北师范大学;2006年
6 董梅;文本内容的信息过滤技术研究[D];合肥工业大学;2006年
7 李洋;企业注册登记文件聚类软件设计与实现[D];大连理工大学;2007年
8 吴新涛;基于向量空间模型的网页信息过滤方法研究[D];大连理工大学;2008年
9 赵博;一种基于关键向量的文本分类模型的研究[D];哈尔滨理工大学;2008年
10 赵文鹏;基于自组织特征映射的海洋文献聚类分析的研究与实现[D];中国海洋大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026