收藏本站
《中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集》2006年
收藏 | 手机打开
二维码
手机客户端打开本文

基于内聚度的多文档文摘句子排序

姚超  李生  张姝  郑德权  
【摘要】:多文档文摘的句子排序问题受到的关注一直较少,然而文摘句的顺序对用户正确理解原文意思却起到重要的作用,因此有必要对多文档文摘的句子排序进行研究。本文针对中文新闻摘要系统,给出了一种基于内聚度的自底向上的中文多文档文摘的句子排序算法,该方法能够将相同话题的句子聚到一起,避免了话题中断,从而使文摘更连贯。实验结果表明该方法能够较好的改善文摘的可读性。
【作者单位】:哈尔滨工业大学计算机学院 哈尔滨工业大学计算机学院 哈尔滨工业大学计算机学院 哈尔滨工业大学计算机学院
【关键词】:多文档文摘 句子排序 内聚度 话题排序 话题中断
【基金】:国家自然科学基金(60302021,60373101)的资助
【分类号】:TP391.1
【正文快照】:
l引言 随着互联网的普及,人们可获取的信息,尤其是电子格式的信息迅速增长。为了从这些 海量信息中快速、准确地获取有用信息,文档的自动摘要处理变得越来越重要。但是,仅是 抽取信息是不够的,还需要有效的组织这些信息。例如,在多文档文摘系统中一篇文摘是从 多篇相关

【相似文献】
中国期刊全文数据库 前10条
1 王萌;徐超;李春贵;何婷婷;;一种概念同现模型的多文档文摘研究[J];计算机工程与科学;2011年07期
2 龚书;瞿有利;田盛丰;;基于维基语义的多文档文摘研究[J];南京大学学报(自然科学版);2011年04期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
中国重要会议论文全文数据库 前4条
1 姚超;李生;张姝;郑德权;;基于内聚度的多文档文摘句子排序[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
2 秦兵;刘挺;李生;;基于子主题的多文档文摘[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
3 黄海源;郑德权;赵铁军;;面向特定领域的多文档文摘技术研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
4 马亮;何婷婷;陈劲光;李芳;邵伟;;一种利用关键词提取的面向查询多文档文摘技术[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
中国博士学位论文全文数据库 前2条
1 刘德喜;基于基本要素的多文档自动文摘研究[D];武汉大学;2007年
2 陈劲光;基于云模型的中文面向查询多文档自动文摘研究[D];华中师范大学;2011年
中国硕士学位论文全文数据库 前7条
1 卢冶;基于概念扩充和综合评价的中文自动文摘研究[D];大连理工大学;2006年
2 姚超;中文多文档文摘关键技术研究[D];哈尔滨工业大学;2007年
3 林建国;基于句子排序和组合分类的中文文本分类方法研究[D];哈尔滨工业大学;2007年
4 李艳梅;基于文本相似度的中文文本聚类的研究[D];华北电力大学(北京);2009年
5 岳大鹏;基于话题的多文档文摘技术研究[D];国防科学技术大学;2011年
6 郝志新;基于改进的模糊C均值聚类算法的多文档自动文摘[D];哈尔滨工业大学;2009年
7 张永刚;基于统计的多文档关键短语和文摘抽取研究[D];苏州大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026