收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

使用本体语义提高文本聚类(英文)

罗娜  左万利  袁福宇  张靖波  张慧杰  
【摘要】:为了提高聚类结果和允许在结果中进行选择,将本体语义与文档聚类相结合,在文档处理过程中提出了基于WordNet的新的文档聚类算法.首先通过tf-idf对文档进行了表示,为了将WordNet的概念出现在文档集合中,通过新的实体对每一个单词向量进行扩展.其次,运用特征提取算法对文档进行特征提取.最后提出了本体集合聚类算法用以提高文本的聚类效果.实验构建在Reuters 20新闻组的数据基础上,应用互信息作为试验结果的比较.结果表明:与已经存在的一些算法如MNB,CLU- TO,co-clustering等相比,基于本体的聚类算法在文本聚类上有很明显的提高.

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 郝剑;高茂庭;;基于模糊相似度的RPCL文本聚类算法[J];电脑知识与技术;2011年18期
2 崔新会;何志强;;浅析基于语义web的信息检索优化及实现[J];科技致富向导;2011年20期
3 黎慧;魏星;;面向旅游领域的语义查询扩展[J];桂林航天工业高等专科学校学报;2011年02期
4 王满霞;;基于本体的机械制造知识研究[J];机电信息;2011年24期
5 唐海英;王体春;;基于EDAM本体的约束引导工作流构建[J];计算机时代;2011年07期
6 冯霞;闫冠男;李娟娟;;一种基于潜在语义索引的谱聚类方法研究[J];中国民航大学学报;2011年03期
7 常丽丽;云红艳;;基于海洋生态本体的知识管理系统的研究与实现[J];青岛大学学报(自然科学版);2011年02期
8 舒飞跃;;基于知识本体的土地管理空间数据共享应用研究[J];国土资源信息化;2011年04期
9 耿晓平;;基于本体的决策树算法在应急决策系统中的研究[J];机械管理开发;2011年04期
10 张鼐;;一种基于语义Web的数字图书馆模型研究[J];图书馆学研究;2011年17期
11 孙伟;马沁怡;高天一;袁长峰;;基于本体和规则的产品配置系统研究[J];大连理工大学学报;2011年04期
12 王春腾;符传谊;邢洁清;;一种改进的谱聚类方法及其在文本分析中的应用[J];电脑知识与技术;2011年16期
13 苏喻;郑诚;马中杰;;基于语义的VSM模型改进[J];计算机应用与软件;2011年08期
14 康晓东;刘海岩;;语义服务匹配方法[J];硅谷;2011年16期
15 孙桂煌;;一种基于n-gram短语的文本聚类方法研究[J];现代计算机(专业版);2011年14期
16 何峰;丁晓青;;结合文本聚类和文本检索的语料选取方法[J];高技术通讯;2010年12期
17 钟将;刘龙海;梁传伟;;基于成对约束的主动半监督文本聚类[J];计算机工程;2011年13期
18 颜晶晶;;带约束本体语义扩展的信息过滤算法[J];计算机应用;2011年07期
19 周鑫;郝志峰;蔡瑞初;温雯;;带噪声的文本聚类及其在反垃圾邮件中的应用[J];广西师范大学学报(自然科学版);2011年02期
20 张永伟;何世钧;;基于图像的黑鱼几何特征本体获取和构建方法研究[J];湖南农业科学;2011年08期
中国重要会议论文全文数据库 前10条
1 罗娜;左万利;袁福宇;张靖波;张慧杰;;使用本体语义提高文本聚类(英文)[A];全国语域web与本体能研讨会论文集[C];2006年
2 颜端武;李晓鹏;王磊;成晓;;文本聚类中基于本体的相似性测度(英文)[A];全国语域web与本体能研讨会论文集[C];2006年
3 伍伟;李兵;曾诚;;基于本体的语义Web服务注册平台研究[A];2008年全国开放式分布与并行计算机学术会议论文集(下册)[C];2008年
4 广凯;魏鲲;金浩;潘金贵;;一种基于本体的上下文模型[A];第二届和谐人机环境联合学术会议(HHME2006)——第2届中国普适计算学术会议(PCC'06)论文集[C];2006年
5 王肃;杜军平;高田;;基于本体与知识背景的模式挖掘框架研究[A];2009年中国智能自动化会议论文集(第二分册)[C];2009年
6 蒋志华;姜云飞;;一种构造Prolog程序子句本体的方法(英文)[A];全国语域web与本体能研讨会论文集[C];2006年
7 骆正华;;基于E-Chunk问句实例库问答系统的研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
8 朱永利;王新颖;程冬玲;;基于本体的风电场信息模型的OWL描述[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
9 王翠茹;辛锐;韩晓娜;;基于本体的电网调度系统知识表示的研究[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
10 易绵竹;姚爱钢;刘万义;;从计算语义学角度看俄语形容词的语义分类问题[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
中国博士学位论文全文数据库 前10条
1 杜文华;本体的构建及其在数字图书馆中的应用研究[D];武汉大学;2005年
2 安杨;基于本体的网络地理服务中的关键问题研究[D];武汉大学;2005年
3 徐森;文本聚类集成关键技术研究[D];哈尔滨工程大学;2010年
4 王永恒;海量短语信息挖掘技术的研究与实现[D];国防科学技术大学;2006年
5 孟宪军;互联网文本聚类与检索技术研究[D];哈尔滨工业大学;2009年
6 胡鹤;本体方法及其时空推理应用研究[D];吉林大学;2004年
7 王真星;基于本体的计算机支持协同学习关键技术研究[D];复旦大学;2003年
8 金鑫;基于本体的领域信息交互语义化研究[D];东华大学;2005年
9 崔巍;用本体实现地理信息系统语义集成和互操作[D];武汉大学;2004年
10 郝立丽;汉语文本数据挖掘[D];吉林大学;2009年
中国硕士学位论文全文数据库 前10条
1 王曙光;基于蚁群的文本聚类算法的改进研究[D];大连理工大学;2006年
2 赵颖;基于Ontology的Web文本聚类研究[D];西华大学;2011年
3 简艳;基于潜在语义的中文文本聚类及其应用[D];东北大学;2008年
4 俞文明;Web中文文本聚类研究[D];杭州电子科技大学;2009年
5 何晏成;基于近邻传播和凝聚层次的文本聚类方法[D];哈尔滨工业大学;2010年
6 梁维铿;基于Hadoop的分布式文本聚类研究[D];华南理工大学;2011年
7 张金;个性化信息检索系统中文本聚类的研究[D];东北师范大学;2010年
8 于丽丽;基于DK-Means算法的文本聚类的研究与实现[D];东北大学;2008年
9 李梅;改进的K均值算法在中文文本聚类中的研究[D];安徽大学;2010年
10 王飞;基于蚁群优化的模糊文本聚类算法研究[D];河南工业大学;2010年
中国重要报纸全文数据库 前10条
1 范力;有道推出桌面词典企业版[N];科技日报;2009年
2 中国科学院计算技术研究所 黄瑞史忠植;加强知识的共享与重用[N];计算机世界;2007年
3 本报记者 李响;丁磊:全力打造中文搜索引擎[N];计算机世界;2008年
4 北京地税个税SOA项目组;让SOA更智能[N];计算机世界;2009年
5 本报记者 廖剑锋;词典软件告别盒装 用户尽享免费翻译服务[N];通信信息报;2011年
6 王培森;从Web挖到竞争情报[N];中国计算机报;2003年
7 宁海伟;名人CE开启崭新的windows学英语时代[N];中国电脑教育报;2006年
8 余海玲 本报记者  马里;金山词霸用十年典藏版贺岁[N];大众科技报;2006年
9 中科院计算技术研究所 吕雅娟付雷 黄瑾 何中军 刘群;化繁为简的统计机器翻译技术[N];中国计算机报;2007年
10 ;原版VS Remux[N];中国电脑教育报;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978