收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

LDA主题驱动的中文多文档自动文摘方法

张明慧  王红玲  周国栋  
【摘要】:多文档自动文摘能够帮助人们自动、快速地获取信息,本文实现了一个基于主题模型的中文多文档自动文摘系统,其中主题模型采用浅层狄利赫雷分配(Latent Dirichlet Allocation,LDA),该模型是一个多层的产生式概率模型,能够检测文档中的主题分布。该方法使用LDA为多文档集合建模,通过计算句子在不同主题上的概率分布之间的相似度作为句子的重要度,并根据句子重要度进行文摘句的抽取。实验结果表明,该方法所得到的文摘,性能优于传统的文摘方法。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 叶星火;胡珀;张小鹏;;基于特征信息提取的中文自动文摘方法[J];计算机应用与软件;2008年05期
2 邓箴;包宏;;基于条件随机场的中文自动文摘系统[J];西安石油大学学报(自然科学版);2009年01期
3 陈戈;段建勇;陆汝占;;基于潜在语义索引和句子聚类的中文自动文摘[J];计算机仿真;2008年07期
4 陈英芝;;基于语义的中文自动文摘方法[J];科技信息;2009年30期
5 胡珀;何婷婷;姬东鸿;;基于主题区域发现的中文自动文摘研究[J];计算机科学;2005年01期
6 索红光;曹淑英;;基于组块的中文自动文摘系统研究[J];计算机系统应用;2007年03期
7 郭庆琳,樊孝忠,柳长安;基于文本聚类和NLU的自动文摘研究[J];北京理工大学学报;2005年08期
8 郭庆琳;樊孝忠;柳长安;;基于文本聚类的自动文摘系统的研究与实现[J];计算机工程;2006年04期
9 罗洋;;基于综合的自动文摘方法研究[J];牡丹江师范学院学报(自然科学版);2009年03期
10 黄钢石;陆建江;张亚非;;文本信息处理中的自动文摘方法研究[J];军事通信技术;2004年01期
11 于海滨;秦兵;刘挺;郎君;;命名实体识别和指代消解在文摘系统中的应用[J];计算机应用研究;2006年04期
12 索红光;安迪;;聚焦查询的自动文摘研究与实现[J];计算机工程与应用;2010年14期
13 王志琪;王永成;刘传汉;;基于互增强关系的自动文摘句子加权方法[J];上海交通大学学报;2007年08期
14 徐超;王萌;何婷婷;张勇;;基于局部主题关键句抽取的自动文摘方法[J];计算机工程;2008年22期
15 龚书;瞿有利;田盛丰;;基于语义的自动文摘研究综述[J];北京交通大学学报;2009年05期
16 刘兴林;郑启伦;马千里;;一种基于主题词集的自动文摘方法[J];计算机应用研究;2011年04期
17 吴岩;李秀坤;;自动文摘基集语句的提取与润色的数学模型[J];计算机应用研究;2007年05期
18 刘德喜;吴世汉;万常选;;XML文本自动文摘研究综述[J];计算机应用研究;2009年11期
19 程传鹏;;基于训练集的自动文摘方法的研究[J];中原工学院学报;2011年01期
20 郭玉箐,万敏,罗振声;面向非受限领域的综合式自动中文文摘方法[J];清华大学学报(自然科学版);2002年01期
中国重要会议论文全文数据库 前10条
1 张明慧;王红玲;周国栋;;LDA主题驱动的中文多文档自动文摘方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
2 余骁捷;邵阳;吴及;王侠;;基于SVM和MMR融和的自动文摘方法[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
3 耿崇;宋丹;薛德军;张灿;;基于词位置与同现特征的中文自动文摘研究[A];第五届全国信息检索学术会议论文集[C];2009年
4 吕静;昝红英;;基于语义统计的中文自动文摘研究[A];第三届学生计算语言学研讨会论文集[C];2006年
5 刘海涛;老松杨;吴玲达;;基于段落自适应聚类的自动文摘系统研究[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
6 翁伟;王厚峰;;基于LDA的关键词抽取方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
7 王小磊;张瑾;许洪波;;基于交互增强原理的多文档自动文摘算法[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
8 董婧灵;李芳;何婷婷;涂新辉;万剑;;基于LDA模型的文本聚类研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
9 刘振鹿;王大玲;冯时;张一飞;方东昊;;一种基于LDA的潜在语义区划分及Web文档聚类算法[A];第六届全国信息检索学术会议论文集[C];2010年
10 王秀娟;郑康锋;杨星海;;线性鉴别分析在中文文本分类中的应用[A];2005通信理论与技术新进展——第十届全国青年通信学术会议论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 李博;基于LDA和LSA的医学文本和影像分析模型及应用研究[D];吉林大学;2012年
2 姜嘉言;用于人脸识别的产生式模型和判别式模型中若干问题的研究[D];复旦大学;2009年
3 李世奇;面向文景转换的中文浅层语义分析方法研究[D];哈尔滨工业大学;2011年
4 李旭;基于指纹和语义知识表示的中文文档复制检测方法[D];燕山大学;2010年
5 文娟;统计语言模型的研究与应用[D];北京邮电大学;2010年
6 王会珍;文本内容分类和主题追踪关键技术研究[D];东北大学;2008年
7 赵世奇;基于统计的复述获取与生成技术研究[D];哈尔滨工业大学;2009年
8 屠晓;英文地址图像识别与翻译研究[D];华东师范大学;2011年
9 杨卉;Web文本观点挖掘及隐含情感倾向的研究[D];吉林大学;2011年
10 郭眈;中文互联网视频搜索引擎系统策略研究[D];北京交通大学;2012年
中国硕士学位论文全文数据库 前10条
1 高超;一种基于综合背景概念格的中文自动文摘方法[D];中南大学;2011年
2 王晖;面向Web论坛的自动文摘方法的研究[D];山东大学;2010年
3 董婧灵;基于LDA模型的文本聚类研究[D];华中师范大学;2012年
4 谢静;基于LDA与SVM的文本分类研究[D];河北大学;2012年
5 苗家;Blog文档的自动文摘方法研究[D];山东大学;2011年
6 黄波;基于向量空间模型和LDA模型相结合的微博客话题发现算法研究[D];西南交通大学;2012年
7 张梦笑;基于LDA模型的观点聚类研究[D];山西大学;2012年
8 宋志理;基于LDA模型的文本分类研究[D];西安理工大学;2010年
9 李春晓;基于LDA的人脸识别[D];西安电子科技大学;2011年
10 周昌亮;基于LDA和KDA的人脸识别算法研究[D];浙江理工大学;2012年
中国重要报纸全文数据库 前10条
1 本报记者 原小瑛;欧特克发布中文工厂设计软件[N];中国化工报;2010年
2 李炳胜;雨林木风转向Linux 作秀还是新开拓?[N];电脑报;2009年
3 罗强;WinXP简体中文家庭版降价超50%[N];中国计算机报;2008年
4 记者 向杰;网络化中文办公平台获“核高基”立项[N];科技日报;2011年
5 王文;中文家庭版仅售399元[N];江苏科技报;2008年
6 本报记者 赵垒;手机中文上网助百万企业上3G[N];中华工商时报;2009年
7 利川市教育局 梅文平;山里娃的“空中课堂”[N];湖北日报;2008年
8 商报实习记者 徐兰;风险投资新宠协同写作成为数字出版领域新势力[N];北京商报;2008年
9 赵齐;中美交流数字图书馆资源建设[N];国际商报;2008年
10 记者 罗添;微软正版XP售价狂降六成[N];北京商报;2008年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978