收藏本站
《第四届全国信息检索与内容安全学术会议论文集(上)》2008年
收藏 | 手机打开
二维码
手机客户端打开本文

面向特定领域的多文档文摘技术研究

黄海源  郑德权  赵铁军  
【摘要】:多文档文摘是针对信息源由多篇关于同一主题文档组成的文档集合,从信息源中提取重要信息、生成精简版本的过程。本文主要研究了面向特定领域的多文档文摘技术,提出了多文档主题签名技术,句子加权算法以及文摘系统的评测模型。利用这些技术实现了一个面向特定领域的多文档文摘系统,同时还实现了一个基于传统多文档技术的系统用以评测时进行对照。最后本文对文摘系统进行了评测,证明了本文所研究实现的多文档文摘模型的有效性和可用性。
【作者单位】:教育部—微软语言语音重点实验室,哈尔滨工业大学
【关键词】:多文档文摘 主题签名 文摘句加权 文摘评测
【基金】:国家自然科学基金(60736044) 863高科技项目(2006AA01Z1150,2006AA010108)资助。
【分类号】:TP391.1
【正文快照】:
1引言随着互联网时代的到来,如何有效地组织和分析信息,提高人们获取信息的效率,成为满足人们需求的关键问题,这使得多文档文摘技术成为研究热点,其进步推动了相关技术的发展.自动文摘是为了达到特定用户或任务要求,从信息源中提取重要信息、生成精简版本的过程.多文档

【参考文献】
中国期刊全文数据库 前1条
1 秦兵;刘挺;陈尚林;李生;;多文档文摘中句子优化选择方法研究[J];计算机研究与发展;2006年06期
【共引文献】
中国期刊全文数据库 前10条
1 赵春红;高希龙;王柠;赵威;刘国华;;一种应用分治策略的中文分词方法[J];燕山大学学报;2009年05期
2 杨晓江;李丽娟;田俊华;李艺;;面向基础教育的Web资源垂直服务体系研究[J];中国远程教育;2006年07期
3 郭涛;曲宝胜;郭勇;;自然语言处理中的模型[J];电脑学习;2011年02期
4 伊力亚尔;古丽拉·阿东别克;;哈萨克文转化系统的研究与实现[J];电脑知识与技术(学术交流);2007年20期
5 刘远超;王晓龙;徐志明;刘秉权;;基于粗集理论的中文关键词短语构成规则挖掘[J];电子学报;2007年02期
6 孙伟;马沁怡;郭莉;高天一;;混合语义模型的产品知识文档检索[J];重庆大学学报;2008年10期
7 黄千;陈笑蓉;倪利华;;水书字音编码研究[J];贵州大学学报(自然科学版);2011年04期
8 张多英;伍伟池;焦文华;;基于数据挖掘的CDMA2000移动网络防盗用技术[J];电讯技术;2012年02期
9 孙铁利;邓凯英;;基于Web的文本信息检索技术[J];信息技术;2007年09期
10 谭骏珊;吴惠雄;;一种改进整词二分法的中文分词词典设计[J];信息技术;2009年05期
中国重要会议论文全文数据库 前4条
1 李帅;王精业;王丽娟;;基于马尔可夫模型的文本信息提取算法概述[A];图像图形技术与应用进展——第三届图像图形技术与应用学术会议论文集[C];2008年
2 李玉良;王良松;李晶;;图像中数字字符识别技术概览[A];节能环保 和谐发展——2007中国科协年会论文集(一)[C];2007年
3 白宇;蔡东风;赵环宇;季铎;;基于语义计算的中文相似问句抽取[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
4 伊力亚尔·加尔木哈买提;尼亚子别克·阿不都加勒力;;哈萨克文自动文本摘要方法浅谈[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 刘德喜;基于基本要素的多文档自动文摘研究[D];武汉大学;2007年
2 马晖男;信息检索中浅层语义模型的研究[D];大连理工大学;2007年
3 郝立柱;汉语文本自动分类[D];吉林大学;2008年
4 陈博;WEB文本情感分类中关键问题的研究[D];北京邮电大学;2008年
5 林民;汉字字形形式化描述方法及应用研究[D];北京工业大学;2009年
6 胡东滨;决策问题管理系统及其开发组件研究[D];中南大学;2008年
7 缪嘉嘉;异构数据映射技术研究[D];国防科学技术大学;2008年
8 孔芳;指代消解关键问题研究[D];苏州大学;2009年
9 杨潇;基于生成性概率模型的句法分析和多文档自动文摘研究[D];山东大学;2009年
10 文娟;统计语言模型的研究与应用[D];北京邮电大学;2010年
中国硕士学位论文全文数据库 前10条
1 吴世汉;面向查询的XML文本摘要技术[D];江西财经大学;2010年
2 黄勇杰;基于统计NLP技术的甲骨卜辞的分析研究[D];华东师范大学;2010年
3 王有权;基于Web的智能答疑技术研究与实现[D];南京财经大学;2010年
4 史迎馨;建筑图中有限自然语言的分析与理解的研究[D];长春工业大学;2010年
5 王阿婷;基于概念集合的网页内容过滤方法的研究[D];北京交通大学;2010年
6 蔡蕊;一种新的搜索引擎分词词典的研究[D];山东大学;2010年
7 吴惠雄;基于支持向量机与聚类算法的中文文本分类研究[D];中南林业科技大学;2009年
8 孙慧;基于组块分析的中文短语情感倾向研究[D];哈尔滨工业大学;2010年
9 薛璐影;文本情感分类相关问题研究[D];哈尔滨工业大学;2010年
10 张练;领域信息抽取相关技术研究[D];哈尔滨工业大学;2010年
【二级参考文献】
中国期刊全文数据库 前2条
1 卢志茂,刘挺,张刚,李生;基于依存分析改进贝叶斯模型的词义消歧[J];高技术通讯;2003年05期
2 秦兵,刘挺,王洋,郑实福,李生;基于常问问题集的中文问答系统研究[J];哈尔滨工业大学学报;2003年10期
【相似文献】
中国期刊全文数据库 前10条
1 王萌;徐超;李春贵;何婷婷;;一种概念同现模型的多文档文摘研究[J];计算机工程与科学;2011年07期
2 龚书;瞿有利;田盛丰;;基于维基语义的多文档文摘研究[J];南京大学学报(自然科学版);2011年04期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
中国重要会议论文全文数据库 前4条
1 黄海源;郑德权;赵铁军;;面向特定领域的多文档文摘技术研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
2 秦兵;刘挺;李生;;基于子主题的多文档文摘[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
3 马亮;何婷婷;陈劲光;李芳;邵伟;;一种利用关键词提取的面向查询多文档文摘技术[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
4 姚超;李生;张姝;郑德权;;基于内聚度的多文档文摘句子排序[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
中国硕士学位论文全文数据库 前6条
1 卢冶;基于概念扩充和综合评价的中文自动文摘研究[D];大连理工大学;2006年
2 姚超;中文多文档文摘关键技术研究[D];哈尔滨工业大学;2007年
3 李艳梅;基于文本相似度的中文文本聚类的研究[D];华北电力大学(北京);2009年
4 岳大鹏;基于话题的多文档文摘技术研究[D];国防科学技术大学;2011年
5 郝志新;基于改进的模糊C均值聚类算法的多文档自动文摘[D];哈尔滨工业大学;2009年
6 张永刚;基于统计的多文档关键短语和文摘抽取研究[D];苏州大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026