收藏本站
《内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集》2007年
收藏 | 手机打开
二维码
手机客户端打开本文

一种面向查询的多文档文摘句选择策略

邵伟  何婷婷  胡珀  肖华松  
【摘要】:针对面向查询的多文档自动文摘,本文提出了一种多特征融合的文摘句选择策略。首先通过计算句子与查询在语义层面上的相似度,获取句子与查询的关联特征,然后运用构建的语义网络图挖掘句子的全局关联特征, 并综合句子的这两方面特征,对其重要度进行评估。最后利用 MMR 技术,挑选文摘句。实验表明:对主题相对集中的文档集合,该方法以10%的压缩率生成的文摘效果较好;对子主题较多且与查询比较相关的文档集合,以 20%的压缩率生成的文摘效果较好。

手机知网App
【引证文献】
中国重要会议论文全文数据库 前1条
1 马亮;何婷婷;陈劲光;李芳;邵伟;;一种利用关键词提取的面向查询多文档文摘技术[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
中国硕士学位论文全文数据库 前4条
1 胡志敏;互联网文本自动文摘技术的研究[D];湘潭大学;2010年
2 李芳;面向查询的多模式自动摘要研究[D];华中师范大学;2009年
3 刘星星;热点事件发现及事件内容特征自动抽取研究[D];华中师范大学;2009年
4 马亮;面向查询多文档文摘的文摘句选择与排序研究[D];华中师范大学;2009年
【共引文献】
中国期刊全文数据库 前3条
1 卫国平;陈俊杰;张健;;基于概念语义的用户兴趣模型的研究[J];电脑开发与应用;2008年08期
2 陆和健;李祝启;;网络信息自动文摘研究[J];情报科学;2008年10期
3 马慧芳;祁云平;杨小东;;一种基于文本关系图的多文档自动摘要技术[J];情报杂志;2007年03期
中国硕士学位论文全文数据库 前10条
1 胡志敏;互联网文本自动文摘技术的研究[D];湘潭大学;2010年
2 吴世汉;面向查询的XML文本摘要技术[D];江西财经大学;2010年
3 徐德玉;中文文档内容相似度检测方法研究[D];长春工业大学;2010年
4 梁浩;网络新闻相似度检测系统[D];吉林大学;2011年
5 杨慧娟;基于语义体与模糊聚类的中文垃圾邮件过滤方法研究[D];兰州理工大学;2011年
6 范洪侠;基于语义网络的自动文摘研究[D];长春理工大学;2011年
7 付玲玲;结合本体HowNet的中文文本分类研究[D];重庆大学;2011年
8 连璐;WEB主题信息采集系统的设计与实现[D];电子科技大学;2011年
9 姚兰;网页主题概念的抽取处理及可视化实现[D];河北科技大学;2012年
10 高静玉;面向Web的中文自动文摘生成的研究[D];沈阳工业大学;2012年
【同被引文献】
中国期刊全文数据库 前6条
1 解(亻刍);汪小帆;;复杂网络中的社团结构分析算法研究综述[J];复杂系统与复杂性科学;2005年03期
2 沈洲,王永成,许一震,方澈;自动文摘系统评价方法的研究与实践[J];情报学报;2001年01期
3 王永成,许慧敏;OA中文文献自动摘要系统[J];情报学报;1997年02期
4 刘挺,吴岩,王开铸;基于信息抽取和文本生成的自动文摘系统设计[J];情报学报;1997年S1期
5 刘挺,王开铸;自动文摘的四种主要方法[J];情报学报;1999年01期
6 王志琪;王永成;刘传汉;;基于互增强关系的自动文摘句子加权方法[J];上海交通大学学报;2007年08期
中国重要会议论文全文数据库 前2条
1 胡珀;何婷婷;张勇;;基于网络化数据挖掘策略的中文多文档自动文摘研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
2 肖华松;何婷婷;邵伟;胡珀;;一种改进K-means聚类算法在多文档文摘中的应用[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
【二级引证文献】
中国硕士学位论文全文数据库 前5条
1 吴泽衡;基于话题检测和情感分析的互联网热点分析与监控技术研究[D];华南理工大学;2011年
2 李博;网络热点事件挖掘及特征描述研究[D];国防科学技术大学;2010年
3 张静;基于微博的网络热点发现模型及平台研究[D];华中科技大学;2010年
4 谢宜瑾;网络舆情分析与管理技术的研究与实现[D];广东工业大学;2012年
5 刘佳;面向微博的热点话题发现及跟踪[D];华南理工大学;2012年
【二级参考文献】
中国期刊全文数据库 前3条
1 吕学强,任飞亮,黄志丹,姚天顺;句子相似模型和最相似句子查找算法[J];东北大学学报;2003年06期
2 林鸿飞,高仁璟;基于潜在语义索引的文本摘要方法[J];大连理工大学学报;2001年06期
3 郭燕慧,钟义信,马志勇,姚均勇;自动文摘综述[J];情报学报;2002年05期
【相似文献】
中国期刊全文数据库 前10条
1 张恒;吴晓娟;董文会;;基于模糊融合的驾驶员眼睛状态识别[J];计算机应用;2007年02期
2 张阳,张利军,闫剑锋,李战怀;基于关联特征的朴素贝叶斯文本分类器[J];西北工业大学学报;2004年04期
3 周斌;林喜荣;贾惠波;宋榕;;多特征融合的手背血管识别算法[J];清华大学学报(自然科学版);2007年02期
4 刘贵喜;范春宇;高恩克;;基于粒子滤波与多特征融合的视频目标跟踪[J];光电子.激光;2007年09期
5 刘李敦;王星;;基于多特征融合的图像检索技术研究[J];计算机时代;2008年08期
6 胡全;邱兆文;王霓虹;;基于多特征融合的图像语义标注[J];东北林业大学学报;2008年10期
7 任彪;樊祥;马东辉;;基于多特征融合与粒子滤波的红外弱小目标跟踪方法[J];弹箭与制导学报;2009年05期
8 黄敏;姜静;;基于多特征自适应阈值检测的关键帧提取[J];郑州轻工业学院学报(自然科学版);2009年06期
9 杜艳明;龙丹;;多特征融合的人脸检测[J];武汉理工大学学报;2010年23期
10 唐科萍;袁思达;;一种改进的人脸检测新技术[J];电脑知识与技术;2011年01期
中国重要会议论文全文数据库 前10条
1 邵伟;何婷婷;胡珀;肖华松;;一种面向查询的多文档文摘句选择策略[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
2 胡珀;何婷婷;张勇;;基于网络化数据挖掘策略的中文多文档自动文摘研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
3 肖华松;何婷婷;邵伟;胡珀;;一种改进K-means聚类算法在多文档文摘中的应用[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
4 杨潇;马军;杨同峰;杜言琦;邵海敏;;基于主题模型LDA的多文档自动摘要[A];第五届全国信息检索学术会议论文集[C];2009年
5 张刚;王斌;程学旗;;基于链接的分布式信息检索文档划分研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
6 李静静;闫宏飞;;中文网页信息检索测试集的构建、分析及应用[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
7 毕文静;沈华伟;刘悦;许洪波;程学旗;;整合搜索引擎结果的专家检索[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
8 毕文静;沈华伟;刘悦;许洪波;程学旗;;基于企业环境的专家检索研究[A];第五届全国信息检索学术会议论文集[C];2009年
9 马亮;陈群秀;谭伟;;智能Web信息检索相关研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
10 刘寒磊;关毅;徐永东;;多文档文摘中基于语义相似度的最大边缘相关技术研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
中国重要报纸全文数据库 前10条
1 本报记者 贾婧;书生SEP:全面e化传统纸张[N];科技日报;2006年
2 北京大学 王万平;支持质量保证的协同开发环境[N];中国计算机报;2007年
3 寿栋芯语;揭开企业搜索的技术面纱[N];计算机世界;2008年
4 骆卫华 刘群 张俊林;搜索引擎:性能提高遇到瓶颈[N];计算机世界;2006年
5 陈艳;SA方法自动化[N];中国电脑教育报;2003年
6 清华大学计算机系智能技术与系统国家重点实验室 张敏 金奕江;“海”中捞“珍”[N];计算机世界;2003年
7 清华大学计算机系智能技术与系统国家重点实验室 张敏 金奕江;寻“宝”有术[N];计算机世界;2003年
8 喻巧云;配置管理变更的关键路径[N];中国计算机报;2007年
9 陈娟;“配”好你的软件[N];中国计算机报;2002年
10 郭莹;UOF-OOXML转换器开发取得阶段性成果[N];中国计算机报;2008年
中国博士学位论文全文数据库 前10条
1 徐永东;多文档自动文摘关键技术研究[D];哈尔滨工业大学;2007年
2 陈劲光;基于云模型的中文面向查询多文档自动文摘研究[D];华中师范大学;2011年
3 李先锋;基于特征优化和多特征融合的杂草识别方法研究[D];江苏大学;2010年
4 黎志升;地理信息检索若干技术研究[D];中国科学技术大学;2009年
5 茹昭;企业信息检索中的对象检索方法研究[D];北京邮电大学;2008年
6 易高翔;粗糙集在Web挖掘中的应用研究[D];华中科技大学;2006年
7 钟敏娟;基于检索结果聚类的XML伪反馈技术研究[D];江西财经大学;2012年
8 徐建民;基于术语关系的贝叶斯网络信息检索模型扩展研究[D];天津大学;2007年
9 田纲;基于多特征融合的Mean shift目标跟踪技术研究[D];武汉大学;2011年
10 刘德喜;基于基本要素的多文档自动文摘研究[D];武汉大学;2007年
中国硕士学位论文全文数据库 前10条
1 邵伟;面向查询的多文档自动文摘研究[D];华中师范大学;2008年
2 肖华松;基于自适应聚类的中文多文档自动文摘研究[D];华中师范大学;2008年
3 肖欣延;基于词汇链和PageRank的多文档自动文摘研究[D];厦门大学;2008年
4 REFAS BENABDELLAH;使用跟踪移动对象多特征融合[D];哈尔滨工程大学;2011年
5 云晓燕;多文档自动文摘系统的研究与应用[D];辽宁科技大学;2008年
6 安迪;基于名实体的自动综述系统研究[D];中国石油大学;2009年
7 张兆年;基于多特征融合的中文情感分类方法研究[D];江西财经大学;2012年
8 张聪;基于多特征融合技术的商标检索系统[D];北京印刷学院;2011年
9 张利军;数据挖掘系统及其应用研究——用关联特征提高朴素贝叶斯文本分类器的性能[D];西北工业大学;2003年
10 彭敦志;基于聚集系数的文本检索查询性能预测[D];中国科学技术大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026