收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

中文文本聚类在互联网搜索的研究与应用

白刚  张铮  丁宗尧  朱毅  
【摘要】:本文提出了一种中文文本聚类的方法,并将其用于互联网搜索结果的文本分类上。实验证明,该方法在一定程度上,根据语义,较好地对搜索结果进行了文本分类。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 田胜利;熊德兰;;基于改进仿射传播聚类的文本自适应模糊聚类[J];小型微型计算机系统;2010年11期
2 黄承慧;印鉴;侯昉;;一种结合词项语义信息和TF-IDF方法的文本相似度量方法[J];计算机学报;2011年05期
3 龚静;周经野;;一种基于多重因子加权的文本特征项权值计算方法[J];计算技术与自动化;2007年01期
4 何峰;丁晓青;;结合文本聚类和文本检索的语料选取方法[J];高技术通讯;2010年12期
5 金春霞;周海岩;;位置加权文本聚类算法[J];计算机工程与科学;2011年06期
6 杜长海;吉根林;;基于微粒群优化算法的文本模糊聚类方法[J];南京师范大学学报(工程技术版);2006年02期
7 马晓雷;文秋芳;;基于文本聚类的被引内容分析——一种分析领域知识的新方法[J];图书情报工作;2011年04期
8 郭庆琳,樊孝忠;基于文本聚类和NLU的自动文摘系统的研究与实现[J];现代电力;2004年04期
9 郭庆琳,樊孝忠,柳长安;基于文本聚类和NLU的自动文摘研究[J];北京理工大学学报;2005年08期
10 郭庆琳;樊孝忠;柳长安;;基于文本聚类的自动文摘系统的研究与实现[J];计算机工程;2006年04期
11 巩知乐;张德贤;;文本挖掘理论概述[J];福建电脑;2008年09期
12 姚清耘;刘功申;李翔;;基于向量空间模型的文本聚类算法[J];计算机工程;2008年18期
13 门国尊;;用于信息检索的文本聚类技术[J];今日科苑;2008年20期
14 李众;梁志剑;;一种改进的文本聚类算法[J];陕西科技大学学报(自然科学版);2008年06期
15 张春炉;沈建京;;基于SOM算法的文本聚类实现[J];计算机与现代化;2010年01期
16 马玉春,宋瀚涛;基于搜索引擎的知识发现[J];计算机工程与应用;2004年30期
17 马辉民;李卫华;吴良元;;VSM在中文文本聚类中的应用及实证分析[J];武汉理工大学学报(信息与管理工程版);2006年04期
18 张刚;周昭涛;王斌;;基于主题的分布式信息检索技术研究[J];计算机工程;2006年12期
19 曲皎;李白桦;;基于KL准则层次文本聚类[J];辽宁师范大学学报(自然科学版);2008年01期
20 李华云;;基于潜在语义分析的中文文本聚类方法研究[J];科技情报开发与经济;2008年27期
中国重要会议论文全文数据库 前10条
1 白刚;张铮;丁宗尧;朱毅;;中文文本聚类在互联网搜索的研究与应用[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
2 刘群;张浩;白硕;;中文信息处理开放平台的设计[A];第一届学生计算语言学研讨会论文集[C];2002年
3 支流;朱学锋;段慧明;俞士汶;;中文缩略语还原技术初探[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
4 郑家恒;谭红叶;王兴义;;基于模式匹配的中文专有名词识别[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
5 葛诗利;陈潇潇;;中国EFL学习者自动作文评分探索[A];第三届学生计算语言学研讨会论文集[C];2006年
6 宋柔;;自然语言处理中语言知识的基础性地位[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
7 杨丽鹏;林世平;;基于关联规则和自然语言处理技术的概念间非分类关系的抽取[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年
8 孙玉芳;;中文信息处理与国家信息化建设[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
9 张玥杰;徐智婷;钱晶;张涛;;自然语言处理中专名识别方法的研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
10 冯元勇;孙乐;张大鲲;李文波;;基于单字提示特征的中文命名实体识别快速算法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 孟宪军;互联网文本聚类与检索技术研究[D];哈尔滨工业大学;2009年
2 卢延鑫;基于自然语言处理技术的循证医学信息提取研究[D];复旦大学;2011年
3 徐森;文本聚类集成关键技术研究[D];哈尔滨工程大学;2010年
4 李良炎;基于词联接的自然语言处理技术及其应用研究[D];重庆大学;2004年
5 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年
6 周雅倩;最大熵方法及其在自然语言处理中的应用[D];复旦大学;2005年
7 郝立丽;汉语文本数据挖掘[D];吉林大学;2009年
8 易勇;计算机辅助诗词创作中的风格辨析及联语应对研究[D];重庆大学;2005年
9 方宁;基于认知的文本语境生成和度量研究[D];上海大学;2009年
10 王燚;基于场景化知识表示的自然语言处理及其在自动文本校对中的应用[D];西南交通大学;2005年
中国硕士学位论文全文数据库 前10条
1 何晏成;基于近邻传播和凝聚层次的文本聚类方法[D];哈尔滨工业大学;2010年
2 张金;个性化信息检索系统中文本聚类的研究[D];东北师范大学;2010年
3 李梅;改进的K均值算法在中文文本聚类中的研究[D];安徽大学;2010年
4 王飞;基于蚁群优化的模糊文本聚类算法研究[D];河南工业大学;2010年
5 赵颖;基于Ontology的Web文本聚类研究[D];西华大学;2011年
6 杨彩莲;基于本体的中文文本聚类技术研究[D];辽宁师范大学;2008年
7 郑伟;基于潜在语义索引的文本聚类技术研究[D];沈阳航空工业学院;2009年
8 刘延亮;一种文本聚类原型系统的设计与实现[D];大连理工大学;2006年
9 谷波;基于粗集模型的聚类方法及其在文献过滤系统中的应用[D];山西大学;2004年
10 胡海龙;基于改进的后缀树算法的中英文聚类引擎的实现[D];吉林大学;2008年
中国重要报纸全文数据库 前10条
1 郑昊;数据挖掘加工海量数据[N];中国计算机报;2007年
2 ;开天辟地第一回[N];计算机世界;2002年
3 刘洁;SAS分析产品链增添“新成员”[N];科技日报;2008年
4 运迪;未来电脑什么样[N];山西科技报;2000年
5 王培森;从Web挖到竞争情报[N];中国计算机报;2003年
6 Chris Kanaracus沈建苗 编译;企业搜索的未来[N];计算机世界;2008年
7 ;未来十年展望之体验技术[N];中国计算机报;2010年
8 ;搜索引擎将引入人工智能技术[N];人民邮电;2006年
9 ;BI和文本分析的强强联手[N];网络世界;2007年
10 郭莹;全文检索市场空间大[N];中国计算机报;2006年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978