收藏本站
《第二届全国学生计算语言学研讨会论文集》2004年
收藏 | 手机打开
二维码
手机客户端打开本文

基于hownet概念获取的中文自动文摘系统

王萌  何婷婷  王晓荣  
【摘要】:本文首先基于hownet对多义词进行无导词语消歧处理,然后利用hownet建立的知识库获取文章中词语的概念。并对未登录词语进行概念标注。用概念统计代替传统的词形频率统计方法。选择出与主题相关的若干概念,建立主题概念向量空间模型;通过段落聚类的算法计算出段落重要度;利用段落重要度和主题概念向量空间模型计算出句子重要度,抽取文摘句。通过对抽取出的语句进行句子相似度的计算来提高文摘精确度,设计并实现了一个中文自动文摘系统。

【参考文献】
中国期刊全文数据库 前2条
1 万敏,罗振声,季姮,高小云;基于概念统计的英文自动文摘研究[J];计算机工程与应用;2002年24期
2 孙春葵,李蕾,杨晓兰,钟义信;基于知识的文本摘要系统研究与实现[J];计算机研究与发展;2000年07期
【共引文献】
中国期刊全文数据库 前10条
1 卢志茂;刘挺;李生;;统计词义消歧的研究进展[J];电子学报;2006年02期
2 王继成 ,武港山 ,周源远 ,张福炎;一种篇章结构指导的中文Web文档自动摘要方法[J];计算机研究与发展;2003年03期
3 晋耀红,苗传江;一个基于语境框架的文本特征提取算法[J];计算机研究与发展;2004年04期
4 胡俊华,杨波,李金屏;自然语言理解研究略述[J];济南大学学报(社会科学版);2001年05期
5 厉宇航,罗振声,程慕胜;基于概念层次的英文文本自动分类研究[J];计算机工程与应用;2004年11期
6 王萌,何婷婷,张伟;基于概念向量空间模型的中文自动文摘系统[J];计算机工程与应用;2005年01期
7 谢芳;胡泉;;基于BP神经网络的词义消歧模型[J];计算机工程与应用;2006年12期
8 姜丽华,黄敏,马永光,佟振声;基于Multi-agent技术的Web文本挖掘模型及应用[J];计算机工程;2005年01期
9 何婷婷;徐超;李晶;赵君喆;;基于种子自扩展的命名实体关系抽取方法[J];计算机工程;2006年21期
10 蔡建山;迟呈英;战学刚;王丫;;基于滑动窗口的动态摘要算法[J];计算机工程;2007年06期
中国重要会议论文全文数据库 前5条
1 全昌勤;何婷婷;姬东鸿;;基于义类的无导词义消歧方法的研究[A];第二届全国学生计算语言学研讨会论文集[C];2004年
2 陈浩;何婷婷;代玲;;基于向量空间模型的无导词义消歧[A];第二届全国学生计算语言学研讨会论文集[C];2004年
3 曲维光;董宇;陈钟;陈小荷;;基于语境计算模型的词义消歧[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
4 张仰森;俞士汶;段惠明;吴云芳;;汉语词义自动标注研究软件平台的设计与实现[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
5 张云涛;龚玲;王永成;;基于语料库的朴素贝叶斯方法的词义消歧[A];2005年中国智能自动化会议论文集[C];2005年
中国博士学位论文全文数据库 前3条
1 耿焕同;范例推理与互联网文本信息处理研究[D];中国科学技术大学;2006年
2 何清;机器学习与文本挖掘若干算法研究[D];中国科学院研究生院(计算技术研究所);2002年
3 周文;基于概念的若干知识表示模型及相关方法研究[D];上海大学;2007年
中国硕士学位论文全文数据库 前10条
1 马长林;中文自动文摘技术若干问题的研究[D];华中师范大学;2002年
2 高雷;网络智能过滤系统的设计与实现[D];广东工业大学;2003年
3 管冬根;Web文档中信息的获取与表示研究[D];重庆大学;2003年
4 陈策;基于WEB技术的竞争情报系统的开发与研究[D];华北电力大学(河北);2004年
5 刘亚清;基于词义的汉语排歧方法研究[D];南京理工大学;2004年
6 全昌勤;基于语料库的汉语词义消歧方法研究[D];华中师范大学;2005年
7 陈浩;基于二阶上下文的无导词义消歧研究[D];华中师范大学;2005年
8 许超;汉英双语网页资源中相同事件文本对的提取[D];南京师范大学;2005年
9 林冬雪;基于改进向量空间模型的网络信息检索技术研究[D];重庆大学;2005年
10 郑伟;基于类别均衡的文本分类算法研究[D];西安电子科技大学;2006年
【同被引文献】
中国期刊全文数据库 前9条
1 钟义信;自然语言理解的全信息方法论[J];北京邮电大学学报;2004年04期
2 尹存燕;戴新宇;陈家骏;;Internet上文本的自动摘要技术[J];计算机工程;2006年03期
3 郭庆琳,樊孝忠,柳长安;文本聚类在自动文摘中的应用研究[J];计算机应用;2005年05期
4 庞剑锋,卜东波,白硕;基于向量空间模型的文本自动分类系统的研究与实现[J];计算机应用研究;2001年09期
5 姜贤塔,陈根才;利用语料库技术的中文自动文摘系统[J];中文信息学报;1999年02期
6 薛翠芳,郭炳炎;汉语文本结构的自动分析[J];情报学报;2000年04期
7 郭燕慧,钟义信,马志勇,姚均勇;自动文摘综述[J];情报学报;2002年05期
8 刘挺,王开铸;自动文摘的四种主要方法[J];情报学报;1999年01期
9 郭庆琳,樊孝忠;自然语言理解与智能检索[J];信息与控制;2004年01期
中国硕士学位论文全文数据库 前1条
1 张峰;基于自然语言处理的自动文摘系统[D];电子科技大学;2006年
【二级参考文献】
中国期刊全文数据库 前2条
1 姜贤塔,陈根才;利用字频统计及机器学习的自动文摘方法[J];浙江大学学报(理学版);1997年03期
2 郭玉箐,万敏,罗振声;面向非受限领域的综合式自动中文文摘方法[J];清华大学学报(自然科学版);2002年01期
【相似文献】
中国期刊全文数据库 前10条
1 郭燕慧,钟义信,马志勇,姚均勇;自动文摘综述[J];情报学报;2002年05期
2 王建波,杜春玲,王开铸;基于篇章理解的自动文摘研究[J];中文信息学报;1995年03期
3 郭俊文;中文科技文献自动文摘系统的研究[J];情报探索;1995年04期
4 杨建林;自动文摘的逻辑解释[J];情报理论与实践;2002年02期
5 郭庆琳,樊孝忠,柳长安;文本聚类在自动文摘中的应用研究[J];计算机应用;2005年05期
6 黄河笑,郭俊文;中文科技文献自动文摘系统的研究[J];现代情报;1996年03期
7 刘挺,吴岩,王开铸;基于信息抽取和文本生成的自动文摘系统设计[J];情报学报;1997年S1期
8 沈玮杰;基于文献结构的自动文摘的初探[J];现代图书情报技术;2002年03期
9 金博,史彦军,滕弘飞,艾景波;自动文摘技术及应用[J];计算机应用研究;2004年12期
10 高小云,程慕胜;基于英文文本的自动文摘:技术与展望[J];清华大学教育研究;2002年S1期
中国重要会议论文全文数据库 前10条
1 王萌;何婷婷;王晓荣;;基于hownet概念获取的中文自动文摘系统[A];第二届全国学生计算语言学研讨会论文集[C];2004年
2 王红玲;黄超超;张明慧;周国栋;;面向冗余度控制的中文多文档自动文摘[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 万敏;罗振声;郭玉箐;;自动文摘系统中的意义段划分问题研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
4 李成城;;基于修辞结构理论的自动文摘研究[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
5 桂卓民;何婷婷;陈劲光;李芳;;一种面向查询的多文档自动文摘系统实现方法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
6 刘德喜;姬东鸿;;基于基本要素的文摘内容连贯性评测模型[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
7 王萌;王晓荣;李春贵;唐培和;;基于局部与全局信息的自动文摘算法[A];广西计算机学会2007年年会论文集[C];2007年
8 李立燕;杨国纬;;中文自动文摘系统研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
9 李芳;何婷婷;;面向查询的多模式自动摘要研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
10 ;哈尔滨工业大学智能技术与自然语言处理研究室简介[A];中国中文信息学会第六次全国会员代表大会暨成立二十五周年学术会议中文信息处理重大成果汇报展资料汇编[C];2006年
中国重要报纸全文数据库 前5条
1 李东;企业如何实现信息化[N];中国矿业报;2001年
2 王松奇;炒作“产业投资基金”概念有害[N];中国工商报;2004年
3 汉唐证券研究所 吴圣涛 丰赋;社保基金缘何偏爱一级市场[N];证券日报;2003年
4 ;浙江天宇信息技术有限公司[N];中国计算机报;2009年
5 张雪峰;信息检索技术的新视角[N];中华读书报;2005年
中国博士学位论文全文数据库 前10条
1 韦福如;基于图模型多文档自动文摘研究[D];武汉大学;2009年
2 蒋昌金;基于关键词提取的中文网页自动文摘方法研究[D];华南理工大学;2010年
3 杨潇;基于生成性概率模型的句法分析和多文档自动文摘研究[D];山东大学;2009年
4 陈清才;基于粗集的汉语建模及其应用研究[D];哈尔滨工业大学;2003年
5 赵林;面向查询的多文档自动文摘关键技术研究[D];复旦大学;2008年
6 周文;基于概念的若干知识表示模型及相关方法研究[D];上海大学;2007年
7 刘兴林;中文词汇知识获取算法和语义计算研究及应用[D];华南理工大学;2012年
8 邱桃荣;面向本体学习的粒计算方法研究[D];北京交通大学;2009年
9 李晓光;XML非完全结构查询处理中若干关键技术的研究[D];东北大学;2006年
10 陈莉萍;英汉语篇结构标注理论与实践[D];上海外国语大学;2007年
中国硕士学位论文全文数据库 前10条
1 孟威;面向微博的自动文摘研究[D];昆明理工大学;2012年
2 谢静芝;面向循证医学的多文档自动文摘技术研究[D];大连海事大学;2010年
3 桂卓民;基于事件的多文档自动文摘系统的研究[D];华中师范大学;2010年
4 孟庆富;生物医学多文档自动文摘系统设计与实现[D];哈尔滨工业大学;2010年
5 付红艳;Web多文档自动文摘研究[D];哈尔滨工程大学;2010年
6 张元虹;基于主题划分的中文单文档自动文摘系统的研究[D];昆明理工大学;2009年
7 张明慧;基于主题模型的中英文多文档自动文摘[D];苏州大学;2011年
8 乔小斐;中文自动文摘关键技术的研究与实现[D];西安电子科技大学;2010年
9 张佳培;基于子主题划分和句子特征的中文文档自动文摘研究[D];重庆大学;2012年
10 胡志敏;互联网文本自动文摘技术的研究[D];湘潭大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026