收藏本站
《第三届全国信息检索与内容安全学术会议论文集》2007年
收藏 | 手机打开
二维码
手机客户端打开本文

中文文本聚类在互联网搜索的研究与应用

白刚  张铮  丁宗尧  朱毅  
【摘要】:本文提出了一种中文文本聚类的方法,并将其用于互联网搜索结果的文本分类上。实验证明,该方法在一定程度上,根据语义,较好地对搜索结果进行了文本分类。

【共引文献】
中国期刊全文数据库 前7条
1 戚晓杰;词汇词与语法词——无变汉字遮蔽下汉语词类划分问题症结之所在[J];东方论坛(青岛大学学报);2003年05期
2 武晓丽;曾小鹏;;“词类”不是词法问题[J];临沂大学学报;2012年04期
3 安华林;论语法单位的层级关系[J];濮阳教育学院学报;2002年02期
4 田桂香;教师口语语法的规范问题[J];山东公安专科学校学报;2001年02期
5 金立;汉语常用字中的不成词语素研究[J];绍兴文理学院学报(哲学社会科学版);1999年03期
6 丁建川;略论主谓短语的语法功能[J];泰安教育学院学报岱宗学刊;2001年01期
7 关欣;;汉日语言中省略表达方式的比较研究[J];现代语文(语言研究版);2012年07期
中国博士学位论文全文数据库 前4条
1 王飞华;汉英语气系统对比研究[D];华东师范大学;2005年
2 刘文欣;现代汉语责训句研究[D];黑龙江大学;2010年
3 于长浩;俄汉语句际关系对比研究[D];黑龙江大学;2012年
4 毛帅梅;现代汉语副词及类副词的功能层级研究[D];上海外国语大学;2012年
中国硕士学位论文全文数据库 前10条
1 周睿;动宾式惯用语研究[D];湘潭大学;2010年
2 陈丽萍;法律语汇中的两栖词语[D];山东师范大学;2000年
3 杨荣贤;《新书》动词及相关句法现象研究[D];四川大学;2003年
4 徐琴;《国语》形容词语法试述[D];广西师范大学;2006年
5 郭宝清;“两典”词类标注问题研究[D];福建师范大学;2007年
6 黄魁;“V_1P+V_2+R”结构句法语义分析[D];湘潭大学;2007年
7 李长庆;现代汉语不成词语素研究[D];北京师范大学;2008年
8 李琦;《墨子》代词研究[D];首都师范大学;2008年
9 吴校华;现代汉语拟声词研究[D];南昌大学;2008年
10 齐珍珍;基于语料库的《HSK词汇大纲》兼类词研究[D];山东大学;2009年
【相似文献】
中国期刊全文数据库 前10条
1 田胜利;熊德兰;;基于改进仿射传播聚类的文本自适应模糊聚类[J];小型微型计算机系统;2010年11期
2 黄承慧;印鉴;侯昉;;一种结合词项语义信息和TF-IDF方法的文本相似度量方法[J];计算机学报;2011年05期
3 龚静;周经野;;一种基于多重因子加权的文本特征项权值计算方法[J];计算技术与自动化;2007年01期
4 何峰;丁晓青;;结合文本聚类和文本检索的语料选取方法[J];高技术通讯;2010年12期
5 金春霞;周海岩;;位置加权文本聚类算法[J];计算机工程与科学;2011年06期
6 杜长海;吉根林;;基于微粒群优化算法的文本模糊聚类方法[J];南京师范大学学报(工程技术版);2006年02期
7 马晓雷;文秋芳;;基于文本聚类的被引内容分析——一种分析领域知识的新方法[J];图书情报工作;2011年04期
8 郭庆琳,樊孝忠;基于文本聚类和NLU的自动文摘系统的研究与实现[J];现代电力;2004年04期
9 郭庆琳,樊孝忠,柳长安;基于文本聚类和NLU的自动文摘研究[J];北京理工大学学报;2005年08期
10 郭庆琳;樊孝忠;柳长安;;基于文本聚类的自动文摘系统的研究与实现[J];计算机工程;2006年04期
中国重要会议论文全文数据库 前10条
1 白刚;张铮;丁宗尧;朱毅;;中文文本聚类在互联网搜索的研究与应用[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
2 刘群;张浩;白硕;;中文信息处理开放平台的设计[A];第一届学生计算语言学研讨会论文集[C];2002年
3 支流;朱学锋;段慧明;俞士汶;;中文缩略语还原技术初探[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
4 郑家恒;谭红叶;王兴义;;基于模式匹配的中文专有名词识别[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
5 葛诗利;陈潇潇;;中国EFL学习者自动作文评分探索[A];第三届学生计算语言学研讨会论文集[C];2006年
6 宋柔;;自然语言处理中语言知识的基础性地位[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
7 杨丽鹏;林世平;;基于关联规则和自然语言处理技术的概念间非分类关系的抽取[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年
8 孙玉芳;;中文信息处理与国家信息化建设[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
9 张玥杰;徐智婷;钱晶;张涛;;自然语言处理中专名识别方法的研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
10 冯元勇;孙乐;张大鲲;李文波;;基于单字提示特征的中文命名实体识别快速算法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国重要报纸全文数据库 前10条
1 郑昊;数据挖掘加工海量数据[N];中国计算机报;2007年
2 ;开天辟地第一回[N];计算机世界;2002年
3 刘洁;SAS分析产品链增添“新成员”[N];科技日报;2008年
4 运迪;未来电脑什么样[N];山西科技报;2000年
5 王培森;从Web挖到竞争情报[N];中国计算机报;2003年
6 Chris Kanaracus沈建苗 编译;企业搜索的未来[N];计算机世界;2008年
7 ;未来十年展望之体验技术[N];中国计算机报;2010年
8 ;搜索引擎将引入人工智能技术[N];人民邮电;2006年
9 ;BI和文本分析的强强联手[N];网络世界;2007年
10 郭莹;全文检索市场空间大[N];中国计算机报;2006年
中国博士学位论文全文数据库 前10条
1 孟宪军;互联网文本聚类与检索技术研究[D];哈尔滨工业大学;2009年
2 卢延鑫;基于自然语言处理技术的循证医学信息提取研究[D];复旦大学;2011年
3 徐森;文本聚类集成关键技术研究[D];哈尔滨工程大学;2010年
4 李良炎;基于词联接的自然语言处理技术及其应用研究[D];重庆大学;2004年
5 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年
6 周雅倩;最大熵方法及其在自然语言处理中的应用[D];复旦大学;2005年
7 郝立丽;汉语文本数据挖掘[D];吉林大学;2009年
8 易勇;计算机辅助诗词创作中的风格辨析及联语应对研究[D];重庆大学;2005年
9 方宁;基于认知的文本语境生成和度量研究[D];上海大学;2009年
10 王燚;基于场景化知识表示的自然语言处理及其在自动文本校对中的应用[D];西南交通大学;2005年
中国硕士学位论文全文数据库 前10条
1 何晏成;基于近邻传播和凝聚层次的文本聚类方法[D];哈尔滨工业大学;2010年
2 张金;个性化信息检索系统中文本聚类的研究[D];东北师范大学;2010年
3 李梅;改进的K均值算法在中文文本聚类中的研究[D];安徽大学;2010年
4 王飞;基于蚁群优化的模糊文本聚类算法研究[D];河南工业大学;2010年
5 赵颖;基于Ontology的Web文本聚类研究[D];西华大学;2011年
6 杨彩莲;基于本体的中文文本聚类技术研究[D];辽宁师范大学;2008年
7 郑伟;基于潜在语义索引的文本聚类技术研究[D];沈阳航空工业学院;2009年
8 刘延亮;一种文本聚类原型系统的设计与实现[D];大连理工大学;2006年
9 谷波;基于粗集模型的聚类方法及其在文献过滤系统中的应用[D];山西大学;2004年
10 胡海龙;基于改进的后缀树算法的中英文聚类引擎的实现[D];吉林大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026