收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于短语匹配的中文Web文档聚类算法

汪洋  张磊  章毅  
【摘要】:本文在一种采用图结构、基于短语的文档索引模型的基础上,提出了一种基于短语匹配的、在线的、无需进行中文分词的增量聚类算法来对中文搜索结果进行聚类。结合文档索引模型和该聚类算法,可以有效地完成对搜索引擎所产生结果的增量式自动分类。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 汪全莉;陈代春;;Web数据挖掘在网络教育中的应用[J];中国科技资源导刊;2008年02期
2 傅鹏;张德运;陈海诠;董皓;;基于后缀树词序列核挖掘Web文档[J];微电子学与计算机;2005年12期
3 汪全莉;陈代春;;Web挖掘在网络教育中的应用研究[J];大学图书情报学刊;2008年03期
4 朱慧爽;;Web挖掘在纺织业电子商务中的应用[J];山东纺织经济;2009年04期
5 秦鸿;基于Web的数据挖掘[J];电子科技大学学报;2002年S1期
6 顾晓燕;关于Web挖掘技术的研究[J];电脑知识与技术;2005年02期
7 冯震冬;;Web数据挖掘的研究现状及发展[J];经营管理者;2010年14期
8 李睿,李明;Web数据挖掘技术探讨[J];甘肃科技;2001年03期
9 高丽彬;Web挖掘在校园网学习系统中的应用研究[J];黔南民族师范学院学报;2004年03期
10 宁彬;;基于WEB挖掘的个性化服务研究[J];福建电脑;2006年08期
11 蒋社想;;基于XML的WEB数据挖掘[J];长沙通信职业技术学院学报;2006年04期
12 徐建民;成岳鹏;辛丽军;;一种基于术语簇和关联规则的文档聚类方法[J];计算机工程与应用;2007年05期
13 李翠霞;谭莹军;;关于Web日志挖掘的研究[J];安阳工学院学报;2007年01期
14 尹中强;;电子商务中的Web数据挖掘技术应用[J];科技信息;2007年04期
15 徐伟伟;;基于Web的数据挖掘技术[J];科技信息(科学教研);2007年17期
16 朱慧爽;;基于Agent的Web数据挖掘模型设计[J];科技信息(科学教研);2008年20期
17 郭丽华;;基于WEB数据挖掘及应用研究[J];华章;2009年20期
18 石晶,龚震宇,裘杭萍,张毓森;一种更稳定的链接分析算法——子空间HITS算法[J];吉林大学学报(理学版);2003年01期
19 李泽文;基于Web的数据挖掘技术[J];现代计算机;2004年07期
20 周勇;数据挖掘技术发展综述[J];中国科技信息;2005年16期
中国重要会议论文全文数据库 前10条
1 汪洋;张磊;章毅;;基于短语匹配的中文Web文档聚类算法[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
2 雷庆;吴扬扬;;一种基于语义信息计算XML文档相似度的新方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
3 丁瑾;;基于Web数据挖掘的综述[A];山西省科学技术情报学会学术年会论文集[C];2004年
4 王洪俊;施水才;俞士汶;肖诗斌;;跨语言文档对齐[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
5 师伟;廖闻剑;;数据挖掘在Web上的研究与应用[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
6 张艳;周国祥;;Web挖掘在个性化信息检索中的应用[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
7 宋江春;沈钧毅;;基于CORBA的分布式Web挖掘系统的设计与实现[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年
8 林政;吕雅娟;刘群;马希荣;;基于双语混和网页的平行语料挖掘[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
9 徐斌;顾宏斌;;一种基于模糊分类的多分类文档查找方法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
10 廉鑫;林伟坚;张海威;袁晓洁;;基于双向路径约束模型的XML文档结构相似性度量[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
中国博士学位论文全文数据库 前10条
1 易明;基于Web挖掘的电子商务个性化推荐机理与方法研究[D];华中科技大学;2006年
2 肖敏;基于领域本体的电子商务推荐技术研究[D];武汉理工大学;2009年
3 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年
4 易高翔;粗糙集在Web挖掘中的应用研究[D];华中科技大学;2006年
5 袁方;面向智能信息检索的Web挖掘关键技术研究[D];东北大学;2006年
6 刘宏哲;文本语义相似度计算方法研究[D];北京交通大学;2012年
7 林古立;互联网信息检索中的多样化排序研究及应用[D];华南理工大学;2011年
8 宋玲;语义相似度计算及其应用研究[D];山东大学;2009年
9 杨瑞龙;基于短语特征的Web文档聚类方法研究[D];重庆大学;2010年
10 武威;异质数据相似度学习及其在网络搜索中的应用[D];北京大学;2012年
中国硕士学位论文全文数据库 前10条
1 蒲秋梅;基于XML的Web数据挖掘技术的研究[D];武汉大学;2004年
2 孙丽;Web数据的挖掘方法研究[D];大庆石油学院;2004年
3 牟刚;基于XML的Web信息挖掘技术的研究[D];重庆大学;2004年
4 唐飞龙;Internet信息获取技术的研究[D];合肥工业大学;2002年
5 郭鹏;基于Web数据挖掘分类算法的个性化信息服务[D];太原理工大学;2003年
6 詹晶晶;基于WEB挖掘的网络蜘蛛的研究与实现[D];厦门大学;2007年
7 门志勇;CRM系统及应用研究[D];首都经济贸易大学;2002年
8 祝效普;WEB用户访问序列模式挖掘[D];天津大学;2005年
9 王婷;基于Web挖掘的电子商务推荐系统的应用研究[D];华北电力大学(河北);2008年
10 邹丽霞;基于关联规则挖掘的Web个性化推荐研究[D];郑州大学;2006年
中国重要报纸全文数据库 前5条
1 王培森;从Web挖到竞争情报[N];中国计算机报;2003年
2 涂序彦 陈泓娟;在网络信息海洋中淘金[N];计算机世界;2001年
3 ;Web收获:吸纳有用信息[N];计算机世界;2004年
4 张德政;信息挖掘商业智能之“芯”[N];中国计算机报;2002年
5 本报记者 仝仁;数据库网联服务[N];中国计算机报;2001年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978