收藏本站
《第三届全国信息检索与内容安全学术会议论文集》2007年
收藏 | 手机打开
二维码
手机客户端打开本文

面向中文新闻领域的移动摘要系统

宋锐  林鸿飞  
【摘要】:面向移动终端的自动摘要技术,对摘要本身提出了更严格的字数要求。本文设计了一个面向中文新闻领域的移动摘要系统,提取新闻网页中的最大重复串作为文档的关键词集合,利用编辑距离生成适于在移动终端上显示的摘要。对于含有子标题的文档,采用层次型的摘要结构,以提高摘要的覆盖率,并用基于 QA 的评测方法验证了层次型摘要结构对该类文档的有效性。实验结果表明,生成的移动摘要在字数、可读性和完整性上具有很好的效果。

手机知网App
【参考文献】
中国期刊全文数据库 前1条
1 林鸿飞,高仁璟;基于潜在语义索引的文本摘要方法[J];大连理工大学学报;2001年06期
【共引文献】
中国期刊全文数据库 前6条
1 杨梁彬;文本检索的潜在语义索引法初探[J];大学图书馆学报;2003年06期
2 周强;施水才;李渝勤;吕学强;;句子重述技术在中文文本摘要中的应用[J];情报学报;2008年06期
3 孙海霞;成颖;;潜在语义标引(LSI)研究综述[J];现代图书情报技术;2007年09期
4 索红光;曹淑英;;基于组块的中文自动文摘系统研究[J];计算机系统应用;2007年03期
5 周进华;刘贵全;;基于衰减词共现图的多文档摘要研究[J];小型微型计算机系统;2009年01期
6 林鸿飞;卢冶;王剑峰;宋锐;;基于概念扩充和综合评价的文本综述[J];郑州大学学报(理学版);2007年02期
中国重要会议论文全文数据库 前1条
1 蒋永锴;叶东毅;;基于稀疏非负矩阵分解的自动多文摘方法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
【相似文献】
中国期刊全文数据库 前10条
1 赵作鹏;尹志民;王潜平;许新征;江海峰;;一种改进的编辑距离算法及其在数据处理中的应用[J];计算机应用;2009年02期
2 龚安;刘华山;;基于编辑距离的XML文档结构聚类的改进算法[J];微计算机应用;2008年02期
3 张凯兵;;基于编辑距离的手写数字Freeman链码匹配算法[J];孝感学院学报;2009年06期
4 陈伟,丁秋林;一种XML相似重复数据的清理方法研究[J];北京航空航天大学学报;2004年09期
5 刘劼;;一种文档页面的样式分类方法[J];科技创新导报;2009年15期
6 赵莉;;基于OCR的拼写校正系统[J];兵工自动化;2010年09期
7 郑仕辉,周傲英,张龙;XML文档的相似测度和结构索引研究[J];计算机学报;2003年09期
8 郭浩,欧宗瑛,何洋;一个新的基于细节特征的指纹匹配方法[J];大连理工大学学报;2005年01期
9 刘守群;朱明;谭晓彬;;一种基于树匹配的网页语义块挖掘算法[J];小型微型计算机系统;2009年08期
10 戴东波;熊赟;朱扬勇;;基于参考集索引的高效序列相似性查找算法[J];软件学报;2010年04期
中国重要会议论文全文数据库 前10条
1 宋锐;林鸿飞;;面向中文新闻领域的移动摘要系统[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
2 王斌;郭庆;李中博;杨晓春;;支持块编辑距离的索引结构[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
3 李刚;郭崇慧;林鸿飞;杨志豪;唐焕文;;基于词典法和机器学习法相结合的蛋白质名识别[A];大连理工大学生物医学工程学术论文集(第2卷)[C];2005年
4 王洁;宋柔;;HSK动态作文语料库偏误标注方法研究[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
5 杨洋;杨新武;李玉鉴;;一种基于特征串比较的自动眉毛识别方法[A];图像图形技术研究与应用2009——第四届图像图形技术与应用学术会议论文集[C];2009年
6 吴闯;吴宏林;张俐;刘绍明;;基于文本-模板直接匹配的机器翻译系统[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
7 卢延科;尹宝生;张桂平;苗雪雷;白宇;;基于伪LCS的中文专利句子相似度计算方法[A];第五届全国信息检索学术会议论文集[C];2009年
8 郑仕辉;何奇;张龙;梁宇奇;周傲英;;XML文档的相似测度研究[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
9 龚才春;黄玉兰;许洪波;白硕;;基于多重索引模型的大规模词典近似匹配算法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
10 郑李磊;谢磊;王晓暄;卢咪咪;杨玉莲;张艳宁;;中文新闻字幕自动生成系统的设计与实现[A];第18届全国多媒体学术会议(NCMT2009)、第5届全国人机交互学术会议(CHCI2009)、第5届全国普适计算学术会议(PCC2009)论文集[C];2009年
中国博士学位论文全文数据库 前5条
1 戴东波;序列数据的相似性查询研究[D];复旦大学;2009年
2 肖冰;人脸画像—照片的合成与识别方法研究[D];西安电子科技大学;2010年
3 张天成;实时数据流相关性分析与挖掘技术研究[D];东北大学;2008年
4 张巍;融合FAQ、本体和推理技术的问答系统研究[D];太原理工大学;2011年
5 袁培森;基于LSH的Web数据相似性查询研究[D];复旦大学;2011年
中国硕士学位论文全文数据库 前10条
1 和彦莉;基于图编辑距离的画像识别[D];西安电子科技大学;2010年
2 高宇;编辑距离及其在Penna模型中的应用[D];大连理工大学;2007年
3 宋锐;特定领域的自动摘要生成策略[D];大连理工大学;2009年
4 左新强;时间序列的相似性查找方法研究[D];清华大学;2007年
5 王成龙;XML文档语义相似性研究综述[D];东北师范大学;2009年
6 周奕辛;数据清洗算法的研究与应用[D];青岛大学;2005年
7 范立新;用位并行法进行过滤的中文近似串匹配算法[D];浙江大学;2006年
8 陈廷梁;音乐结构分析及应用[D];哈尔滨工业大学;2006年
9 李星秀;非规则平面碎片匹配关键技术研究[D];西北大学;2006年
10 邱英;基于XML的Web数据存储与数据清洗技术研究与实现[D];武汉理工大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026