收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

面向中文新闻领域的移动摘要系统

宋锐  林鸿飞  
【摘要】:面向移动终端的自动摘要技术,对摘要本身提出了更严格的字数要求。本文设计了一个面向中文新闻领域的移动摘要系统,提取新闻网页中的最大重复串作为文档的关键词集合,利用编辑距离生成适于在移动终端上显示的摘要。对于含有子标题的文档,采用层次型的摘要结构,以提高摘要的覆盖率,并用基于 QA 的评测方法验证了层次型摘要结构对该类文档的有效性。实验结果表明,生成的移动摘要在字数、可读性和完整性上具有很好的效果。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 赵作鹏;尹志民;王潜平;许新征;江海峰;;一种改进的编辑距离算法及其在数据处理中的应用[J];计算机应用;2009年02期
2 龚安;刘华山;;基于编辑距离的XML文档结构聚类的改进算法[J];微计算机应用;2008年02期
3 张凯兵;;基于编辑距离的手写数字Freeman链码匹配算法[J];孝感学院学报;2009年06期
4 陈伟,丁秋林;一种XML相似重复数据的清理方法研究[J];北京航空航天大学学报;2004年09期
5 刘劼;;一种文档页面的样式分类方法[J];科技创新导报;2009年15期
6 赵莉;;基于OCR的拼写校正系统[J];兵工自动化;2010年09期
7 郑仕辉,周傲英,张龙;XML文档的相似测度和结构索引研究[J];计算机学报;2003年09期
8 郭浩,欧宗瑛,何洋;一个新的基于细节特征的指纹匹配方法[J];大连理工大学学报;2005年01期
9 刘守群;朱明;谭晓彬;;一种基于树匹配的网页语义块挖掘算法[J];小型微型计算机系统;2009年08期
10 戴东波;熊赟;朱扬勇;;基于参考集索引的高效序列相似性查找算法[J];软件学报;2010年04期
11 李文;洪亲;滕忠坚;石兆英;胡小丹;刘海博;;基于n-gram的字符串分割技术的算法实现[J];计算机与现代化;2010年09期
12 闫利国;贺飞;;XM L文档结构相似测度研究[J];计算机应用研究;2006年03期
13 刘坤;杨杰;;基于编辑距离的轨迹相似性度量[J];上海交通大学学报;2009年11期
14 刘峥峥;蒋凡;杨俊;;模型转换规则自动生成研究[J];计算机工程与应用;2010年08期
15 赵延平;曹存根;谢丽聪;;基于CRFs和领域规则的业务名称识别[J];计算机工程;2011年11期
16 吕学强,迟呈英;英文光学字符识别的后处理[J];鞍山钢铁学院学报;2002年03期
17 杨长辉;岳友友;;一种基于编辑距离的XML查询方案[J];计算机应用;2006年12期
18 胡双演;李俊山;王蕊;杨威;陈磊;;基于运动轨迹的视频检索方法[J];计算机工程与设计;2008年07期
19 杨志豪;林鸿飞;李彦鹏;;基于编辑距离和多种后处理的生物实体名识别[J];计算机工程;2008年17期
20 程树明;古天龙;;基于拓扑子图与编辑距离的距离测量方法[J];桂林电子科技大学学报;2009年01期
中国重要会议论文全文数据库 前10条
1 宋锐;林鸿飞;;面向中文新闻领域的移动摘要系统[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
2 王斌;郭庆;李中博;杨晓春;;支持块编辑距离的索引结构[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
3 李刚;郭崇慧;林鸿飞;杨志豪;唐焕文;;基于词典法和机器学习法相结合的蛋白质名识别[A];大连理工大学生物医学工程学术论文集(第2卷)[C];2005年
4 王洁;宋柔;;HSK动态作文语料库偏误标注方法研究[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
5 杨洋;杨新武;李玉鉴;;一种基于特征串比较的自动眉毛识别方法[A];图像图形技术研究与应用2009——第四届图像图形技术与应用学术会议论文集[C];2009年
6 吴闯;吴宏林;张俐;刘绍明;;基于文本-模板直接匹配的机器翻译系统[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
7 卢延科;尹宝生;张桂平;苗雪雷;白宇;;基于伪LCS的中文专利句子相似度计算方法[A];第五届全国信息检索学术会议论文集[C];2009年
8 郑仕辉;何奇;张龙;梁宇奇;周傲英;;XML文档的相似测度研究[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
9 龚才春;黄玉兰;许洪波;白硕;;基于多重索引模型的大规模词典近似匹配算法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
10 郑李磊;谢磊;王晓暄;卢咪咪;杨玉莲;张艳宁;;中文新闻字幕自动生成系统的设计与实现[A];第18届全国多媒体学术会议(NCMT2009)、第5届全国人机交互学术会议(CHCI2009)、第5届全国普适计算学术会议(PCC2009)论文集[C];2009年
中国博士学位论文全文数据库 前5条
1 戴东波;序列数据的相似性查询研究[D];复旦大学;2009年
2 肖冰;人脸画像—照片的合成与识别方法研究[D];西安电子科技大学;2010年
3 张天成;实时数据流相关性分析与挖掘技术研究[D];东北大学;2008年
4 张巍;融合FAQ、本体和推理技术的问答系统研究[D];太原理工大学;2011年
5 袁培森;基于LSH的Web数据相似性查询研究[D];复旦大学;2011年
中国硕士学位论文全文数据库 前10条
1 和彦莉;基于图编辑距离的画像识别[D];西安电子科技大学;2010年
2 高宇;编辑距离及其在Penna模型中的应用[D];大连理工大学;2007年
3 宋锐;特定领域的自动摘要生成策略[D];大连理工大学;2009年
4 左新强;时间序列的相似性查找方法研究[D];清华大学;2007年
5 王成龙;XML文档语义相似性研究综述[D];东北师范大学;2009年
6 周奕辛;数据清洗算法的研究与应用[D];青岛大学;2005年
7 范立新;用位并行法进行过滤的中文近似串匹配算法[D];浙江大学;2006年
8 陈廷梁;音乐结构分析及应用[D];哈尔滨工业大学;2006年
9 李星秀;非规则平面碎片匹配关键技术研究[D];西北大学;2006年
10 邱英;基于XML的Web数据存储与数据清洗技术研究与实现[D];武汉理工大学;2008年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978