收藏本站
《第十二届全国信号处理学术年会(CCSP-2005)论文集》2005年
收藏 | 手机打开
二维码
手机客户端打开本文

一种基于向量空间模型的文档聚类算法研究

原福永  杨治秋  王海霞  
【摘要】:随着网络信息的迅速增长,文档聚类技术成为了人们研究的热点课题。探讨了典型的基于向量空间模型的文档聚类算法-k-means算法,针对它的不足提出了改进的BK-means算法。最后,根据一定的评价标准,得出BK-means算法是文档聚类算法中较好的算法。
【作者单位】:燕山大学信息科学与工程学院
【分类号】:TP391.1

【参考文献】
中国期刊全文数据库 前1条
1 何飞,蒋冬初;基于向量空间模型的文档聚类算法研究[J];湖南城市学院学报;2003年03期
【共引文献】
中国期刊全文数据库 前2条
1 包金龙;基于向量空间模型的信息检索系统的设计[J];情报杂志;2005年07期
2 何飞,蒋冬初;基于向量空间模型的文档聚类算法研究[J];湖南城市学院学报;2003年03期
中国博士学位论文全文数据库 前1条
1 刘云峰;基于潜在语义分析的中文概念检索研究[D];华中科技大学;2005年
中国硕士学位论文全文数据库 前8条
1 李丽珊;基于动态簇中心迁移的聚类算法及应用[D];福州大学;2005年
2 朱红灿;基于SOM的两阶段中文文本聚类算法的研究[D];湘潭大学;2005年
3 王艳萍;基于XML的移动信息检索模型研究[D];大连理工大学;2006年
4 林冬雪;基于改进向量空间模型的网络信息检索技术研究[D];重庆大学;2005年
5 周利祥;基于遗传算法的神经网络的研究与应用[D];汕头大学;2007年
6 卞荣兵;基于网格密度的数据挖掘的研究与应用[D];南京气象学院;2003年
7 田萱;基于Internet的信息检索若干问题的研究[D];山东师范大学;2003年
8 迟学芝;基于自学习机制的信息过滤模型研究与实践[D];山东师范大学;2005年
【同被引文献】
中国期刊全文数据库 前10条
1 刘乃森;刘福霞;;人工神经网络及其在植物保护中的应用[J];安徽农业科学;2006年23期
2 程新意,杨崇瑞;用模糊分析方法预报越冬代二化螟的发生量[J];安徽农业大学学报;1992年04期
3 曹叶虹,奚建清;如何有效使用雪花模型[J];广东工业大学学报;2002年02期
4 游湘涛,叶施仁,史忠植;多策略通用数据采掘工具MSMiner[J];计算机研究与发展;2001年05期
5 周启生;数据挖掘技术在病虫害防治决策中的应用[J];农业网络信息;2004年07期
6 秦亮曦,史忠植,刘少辉,黄友平,贾自艳,赵雷,李嘉佑;多策略数据挖掘平台MS Miner的元数据管理[J];计算机应用;2003年S2期
7 梁剑,李晓,刘红铄,胡彬华;智能化数据挖掘系统的设计与实现[J];计算机应用研究;2002年05期
8 贾宇波,王永利,孙淑荣;基于J2EE的Web挖掘原型系统的研究与应用[J];计算机应用研究;2003年04期
9 贾澎涛;何华灿;刘丽;孙涛;;时间序列数据挖掘综述[J];计算机应用研究;2007年11期
10 徐义峰,徐云青,陈春明;雪花模型在OLAP多维建模中的应用[J];科技情报开发与经济;2005年01期
中国硕士学位论文全文数据库 前4条
1 赵雷;多策略数据挖掘平台MSMiner构建中若干问题的研究[D];山东科技大学;2003年
2 赵怿甦;数据挖掘在农业环境中的应用[D];天津大学;2004年
3 刘鹏;数据仓库技术在农业环境信息系统中的研究与实现[D];天津大学;2006年
4 罗文静;数据挖掘中可视化技术研究与实现[D];电子科技大学;2007年
【相似文献】
中国期刊全文数据库 前10条
1 刘珺;张文欣;;基于RSS的层次结构用户兴趣模型的分析与设计[J];河南工程学院学报(自然科学版);2011年03期
2 李卫东;陆玲;;融合VSM技术的PageRank算法研究与应用[J];计算机与现代化;2011年07期
3 李虎;邹鹏;贾焰;周斌;;一种基于MapReduce的分布式文本数据过滤模型研究[J];信息网络安全;2011年09期
4 申莹;徐东平;庞俊;;基于概念的中文博客情感极性聚类分析[J];计算机系统应用;2011年08期
5 潘正高;侯传宇;谈成访;;基于命名实体的Web新闻文本分类方法[J];合肥工业大学学报(自然科学版);2011年08期
6 孙桂煌;;一种基于n-gram短语的文本聚类方法研究[J];现代计算机(专业版);2011年14期
7 夏火松;刘建;;文本相似度视角下的虚拟社区评论的可信性分析[J];现代情报;2011年09期
8 孟佳娜;林鸿飞;李彦鹏;;基于特征贡献度的特征选择方法在文本分类中应用[J];大连理工大学学报;2011年04期
9 李志明;李善平;杨朝晖;林欣;;基于本体分割的本体映射算法[J];模式识别与人工智能;2011年02期
10 许志凯;徐志明;李栋;李生;;面向互联网新闻的话题检测与追踪[J];智能计算机与应用;2011年03期
中国重要会议论文全文数据库 前10条
1 原福永;杨治秋;王海霞;;一种基于向量空间模型的文档聚类算法研究[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
2 王桐;刘大昕;田迪;孙伟;张万松;;一种改进的XML向量空间模型及其近似匹配算法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
3 高勇;荀恩东;宋柔;;构造自然语言问答系统平台[A];第二届全国学生计算语言学研讨会论文集[C];2004年
4 买买提依明·哈斯木;维尼拉·木沙江;;研究维吾尔文Web文档聚类算法设计与实现[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
5 喻飞;夏晓燕;吴蓉晖;徐成;;基于向量空间模型的信息安全审计系统[A];第二十六届中国控制会议论文集[C];2007年
6 刘振鹿;王大玲;冯时;张一飞;方东昊;;一种基于LDA的潜在语义区划分及Web文档聚类算法[A];第六届全国信息检索学术会议论文集[C];2010年
7 陈浩;何婷婷;代玲;;基于向量空间模型的无导词义消歧[A];第二届全国学生计算语言学研讨会论文集[C];2004年
8 黄萱菁;夏迎炬;吴立德;;基于向量空间模型的文本过滤系统[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
9 苏贵洋;王永成;马颖华;;信息自动获取的结构模型[A];第一届学生计算语言学研讨会论文集[C];2002年
10 林游龙;余智华;程学旗;刘悦;;虚点:一种减少特征值鸿沟的方法[A];第六届全国信息检索学术会议论文集[C];2010年
中国重要报纸全文数据库 前2条
1 清华大学计算机系智能技术与系统国家重点实验室 张敏 金奕江;寻“宝”有术[N];计算机世界;2003年
2 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
中国博士学位论文全文数据库 前10条
1 杨剑锋;适合并行的无干预文档聚类算法研究[D];武汉大学;2010年
2 孙道军;文本挖掘预处理相关基础技术分析与应用研究[D];北京邮电大学;2008年
3 邢军;领域本体构造中数据源选取及构造方法的研究[D];大连理工大学;2008年
4 夏迎炬;文本过滤关键技术研究[D];复旦大学;2003年
5 杜卫锋;粗糙集理论在中文文本分类中的应用[D];西南交通大学;2006年
6 马晖男;信息检索中浅层语义模型的研究[D];大连理工大学;2007年
7 徐婕;基于对等网络的资源搜索策略的研究[D];华中科技大学;2007年
8 王修力;基于描述复杂性的信息检索理论与若干模型研究[D];北京语言大学;2006年
9 王菁;P2P系统中资源管理机制的研究[D];中国科学技术大学;2007年
10 高茂庭;文本聚类分析若干问题研究[D];天津大学;2007年
中国硕士学位论文全文数据库 前10条
1 褚金正;面向特定领域的文本识别和分类[D];湖南大学;2005年
2 张波;个性化Web搜索系统研究[D];燕山大学;2006年
3 郭妍;基于市长公开电话文本为背景的两种自动分类算法的比较[D];东北师范大学;2006年
4 董梅;文本内容的信息过滤技术研究[D];合肥工业大学;2006年
5 李洋;企业注册登记文件聚类软件设计与实现[D];大连理工大学;2007年
6 吴新涛;基于向量空间模型的网页信息过滤方法研究[D];大连理工大学;2008年
7 赵博;一种基于关键向量的文本分类模型的研究[D];哈尔滨理工大学;2008年
8 赵文鹏;基于自组织特征映射的海洋文献聚类分析的研究与实现[D];中国海洋大学;2009年
9 赵治军;OAI-PMH中元数据相似度计算的研究与实现[D];太原科技大学;2009年
10 段建勇;现代汉语词性细分类标注研究[D];山西大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026