收藏本站
《第二十五届中国数据库学术会议论文集(二)》2008年
收藏 | 手机打开
二维码
手机客户端打开本文

文本摘要算法集成与实现

王慧芳  张勇  邢春晓  张文珂  杨吉江  
【摘要】:自动文本摘要是文本挖掘技术中的一个重要的研究课题.现有的文本摘要系统大多是应用单一方法,基于特定领域提取摘要,不能够应用到各个领域中,所以将各种方法组合起来,将能够解决这个问题.在深入研究6种基本的浅层和实体层的自动摘要算法的基础上,实现多知识源融合的摘要系统,并应用基本的机器学习算法对上述的算法进行了特征组合的分类器的训练、交叉验证和测试,找到最佳的特征组合参数,形成摘要.采用内部评价方法对系统进行了分析评测实验.

【参考文献】
中国期刊全文数据库 前2条
1 陆玉昌,鲁明羽,李凡,周立柱;向量空间法中单词权重函数的分析和构造[J];计算机研究与发展;2002年10期
2 冯长远,普杰信;Web文本特征选择算法的研究[J];计算机应用研究;2005年07期
【共引文献】
中国期刊全文数据库 前10条
1 李文斌;刘椿年;陈嶷瑛;;基于特征信息增益权重的文本分类算法[J];北京工业大学学报;2006年05期
2 顾益军,樊孝忠,王建华,汪涛,黄维金;中文停用词表的自动选取[J];北京理工大学学报;2005年04期
3 鲁明羽,张红,付克明,陆玉昌;Web ME——一个大型网络挖掘环境系统[J];哈尔滨工业大学学报;2004年09期
4 刘涛,吴功宜,陈正;一种高效的用于文本聚类的无监督特征选择算法[J];计算机研究与发展;2005年03期
5 尚文倩;黄厚宽;刘玉玲;林永民;瞿有利;董红斌;;文本分类中基于基尼指数的特征选择算法研究[J];计算机研究与发展;2006年10期
6 石志伟,刘涛,吴功宜;一种快速高效的文本分类方法[J];计算机工程与应用;2005年29期
7 李国臣,段建勇;基于语法语义信息量化模型的语素字再分类[J];计算机工程;2004年11期
8 杨广翔,俞宁,谌莉;搜索引擎结果的重排序方法[J];计算机应用;2005年02期
9 董小国;甘立国;;基于句子重要度的特征项权重计算方法[J];计算机与数字工程;2006年08期
10 周钦强,孙炳达,王义;文本自动分类系统文本预处理方法的研究[J];计算机应用研究;2005年02期
中国重要会议论文全文数据库 前1条
1 赵燕平;李超;;网络安全信息挖掘中的特征选择与专利分析研究[A];2004年中国管理科学学术会议论文集[C];2004年
中国博士学位论文全文数据库 前6条
1 黄定轩;企业核心能力智能挖掘应用基础研究[D];西南交通大学;2005年
2 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年
3 王秀娟;文本检索中若干问题研究[D];北京邮电大学;2006年
4 席运江;组织知识的网络表示模型及分析方法[D];大连理工大学;2007年
5 尚文倩;文本分类及其相关技术研究[D];北京交通大学;2007年
6 马晖男;信息检索中浅层语义模型的研究[D];大连理工大学;2007年
中国硕士学位论文全文数据库 前10条
1 何尧;基于半监督学习的中文文档分类技术研究[D];中南大学;2005年
2 杨盛;电子邮件过滤系统的研究与设计[D];中南大学;2005年
3 叶凌;基于语义的中文搜索引擎[D];吉林大学;2005年
4 廖海波;基于投影寻踪回归的文本分类研究[D];江西师范大学;2005年
5 付雪峰;基于模糊—粗糙集的文本分类模型[D];江西师范大学;2005年
6 朱玮;IRT和规则空间在文本分类中的应用研究[D];江西师范大学;2005年
7 钟福金;语义Web服务发现及其应用研究[D];合肥工业大学;2005年
8 胡蓉;中文Web文档倾向性自动分类研究[D];四川大学;2003年
9 翟静;可扩展的文本分类系统的核心API的设计与实现[D];四川大学;2003年
10 刘钢;基于神经网络的文本分类系统NNTCS的设计和实现[D];中国科学院研究生院(软件研究所);2003年
【二级参考文献】
中国期刊全文数据库 前3条
1 陆玉昌,鲁明羽,李凡,周立柱;向量空间法中单词权重函数的分析和构造[J];计算机研究与发展;2002年10期
2 涂承胜,鲁明羽,陆玉昌;Web内容挖掘技术研究[J];计算机应用研究;2003年11期
3 刘明吉,王秀峰,饶一梅,黄亚楼;Web文本信息的特征获取算法[J];小型微型计算机系统;2002年06期
【相似文献】
中国期刊全文数据库 前10条
1 谷列先;丁晓青;;基于人物关系分析的视频自动摘要算法[J];高技术通讯;2010年09期
2 徐晓丹;;基于半监督学习的中文多文档子主题划分[J];浙江师范大学学报(自然科学版);2011年03期
3 黄长伟;;自动文摘技术研究现状分析[J];中外企业家;2011年14期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 王慧芳;张勇;邢春晓;张文珂;杨吉江;;文本摘要算法集成与实现[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
2 伊力亚尔·加尔木哈买提;尼亚子别克·阿不都加勒力;;哈萨克文自动文本摘要方法浅谈[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
3 张龙凯;王厚峰;;文本摘要中的句子抽取方法研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 章彦星;张铭;邓志鸿;;基于特征的用户评论自动摘要[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
5 李立燕;杨国纬;;中文自动文摘系统研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
6 李芳;何婷婷;;面向查询的多模式自动摘要研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
7 苗家;马军;陈竹敏;;一种基于HITS算法的blog文摘方法[A];第六届全国信息检索学术会议论文集[C];2010年
8 杨潇;马军;杨同峰;杜言琦;邵海敏;;基于主题模型LDA的多文档自动摘要[A];第五届全国信息检索学术会议论文集[C];2009年
9 蒋永锴;叶东毅;;基于稀疏非负矩阵分解的自动多文摘方法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
10 孙玉芳;;中文信息处理与国家信息化建设[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
中国重要报纸全文数据库 前8条
1 马海兵;网络舆情及其分析技术[N];光明日报;2007年
2 咕咚;Blog: 从技术出发[N];计算机世界;2003年
3 海量智能计算技术研究中心 霍刚;新兴技术为互联网加速[N];计算机世界;2007年
4 本报记者 张彤;让计算机说中国话[N];网络世界;2004年
5 本报记者 张晔通讯员 李玮;周志华:永不墨守成规[N];科技日报;2008年
6 姚明;中国物流市场:山雨欲来[N];中国贸易报;2001年
7 ;线点科技:轻松管理互联网[N];中国计算机报;2009年
8 ;谷尼国际:精确监控网络舆情[N];中国计算机报;2009年
中国博士学位论文全文数据库 前10条
1 刘娜;文本自动摘要和信息抽取方法及其应用研究[D];大连海事大学;2012年
2 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
3 刘向威;NLP技术在中文信息检索中的应用研究[D];天津大学;2005年
4 耿焕同;范例推理与互联网文本信息处理研究[D];中国科学技术大学;2006年
5 龙华;定义问答检索关键技术研究[D];重庆大学;2010年
6 金锋;文档摘要算法的研究与应用[D];清华大学;2011年
7 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年
8 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
9 徐昊;基于跨媒体信息和高效图像编码算法的图像搜索关键技术[D];中国科学技术大学;2011年
10 生龙;二型模糊系统理论及应用[D];电子科技大学;2012年
中国硕士学位论文全文数据库 前10条
1 尹显贵;基于Web的企业竞争情报服务平台中多文本摘要技术研究[D];昆明理工大学;2012年
2 章芝青;基于语义的单文档自动摘要研究[D];浙江大学;2010年
3 李阜;基于滑窗取词的单文档自动摘要技术研究[D];国防科学技术大学;2010年
4 阿热帕提·尕依提;基于统计的维吾尔网页自动摘要提取研究[D];新疆大学;2011年
5 余博;基于维基百科的多文档自动摘要系统研究[D];武汉科技大学;2011年
6 商玥;面向概念查询的生物医学多文档摘要技术研究[D];大连理工大学;2011年
7 许旭阳;网络新闻多文档自动摘要技术研究[D];解放军信息工程大学;2011年
8 鲁凡;基于分形理论的自动摘要[D];吉林大学;2004年
9 吴世汉;面向查询的XML文本摘要技术[D];江西财经大学;2010年
10 刘霞;基于潜在语义分析的单文本自动摘要方法研究[D];南京邮电大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026