收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

多文档集合中逻辑主题的确定

秦兵  刘挺  高晔  
【摘要】:把多文档集合中具有相同或相似的句子通过聚类的方法归并成一类,每类即为多文档集合的一个逻辑主题。将多文档集合描述为若干逻辑主题的集合,是从理解的角度来描述多文档集合,在此基础上可以提高多文档文摘的质量。本文首先根据标准语料确定划分逻辑主题的阈值,通过层次聚类方法确定逻辑主题的个数,然后利用k 均值方法对各个类别进行迭代调整,从而提高划分逻辑主题的准确率。实验表明,基于层次聚类的k 均值方法得到的逻辑主题正确率比层次聚类方法得到的逻辑主题正确率平均约高8%。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 陈婷婷;方滨兴;郑军;;基于层次自组织特征映射的网络异常检测系统数据分析器[J];计算机应用与软件;2006年05期
2 李振星,徐泽平,唐卫清,唐荣锡;网页多词元快速聚类算法[J];计算机工程;2003年02期
3 闵敏;;基于聚类协作过滤的商品个性化推荐系统的实现[J];制造业自动化;2010年02期
4 陈谦;高茂庭;;基于SOM的入侵检测方法研究[J];电脑知识与技术;2010年21期
5 李斌;网络的聚类效果[J];管理科学文摘;1999年08期
6 王晓国,朱炜,黄韶坤,李启炎;一种E-mail挖掘方法及其在CRM中的应用[J];计算机工程;2003年15期
7 张健沛,刘洋,杨静,代坤;搜索引擎结果聚类算法研究[J];计算机工程;2004年05期
8 石明洪;罗永军;白英彩;;基于聚类的对等网络负载优化算法研究[J];计算机工程;2006年13期
9 张静舟;刘燕;;RBF神经网络在入侵检测中的应用[J];河南机电高等专科学校学报;2007年02期
10 赵元媛;;Web挖掘与个性化服务研究[J];商场现代化;2007年17期
11 石彦华;李蜀瑜;;基于聚类Web服务的组合服务模式规约[J];计算机应用研究;2011年02期
12 叶芳,吴中福,刘勇国;网络入侵的聚类算法研究与实现[J];重庆大学学报(自然科学版);2004年03期
13 邓爱林,左子叶,朱扬勇;基于项目聚类的协同过滤推荐算法[J];小型微型计算机系统;2004年09期
14 刘勇国;陈克非;;基于混合遗传聚类的入侵检测算法[J];计算机工程;2006年02期
15 忽海娜;万鸿运;程明;;基于拥塞控制的DDoS防御机制的研究[J];微计算机信息;2006年18期
16 刘国军;梁声灼;刘佐斌;;基于数据挖掘的入侵检测技术[J];计算机与现代化;2007年09期
17 郑洪英;廖晓峰;倪霖;肖迪;;进化算法及其在入侵检测中的应用[J];计算机科学;2007年11期
18 郑洪英;倪霖;;一种无监督网络入侵检测算法[J];计算机工程;2008年18期
19 李世明;朱桂英;;基于模糊聚类算法的入侵检测技术研究[J];科技信息(学术研究);2008年28期
20 张祥;石广田;;基于聚类优化的支持QOS语义web服务发现框架研究[J];硅谷;2011年17期
中国重要会议论文全文数据库 前10条
1 秦兵;刘挺;高晔;;多文档集合中逻辑主题的确定[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
2 饶鲜;李斌;杨绍全;;用核聚类法进行异常检测[A];信号与信息处理技术第三届信号与信息处理全国联合学术会议论文集[C];2004年
3 陈明;鹿旸;;基于语义相似度的P2P平衡路由网络[A];2007年全国开放式分布与并行计算机学术会议论文集(下册)[C];2007年
4 戴宣;丁伟;;一种基于索引的TCP数据流存储模型及其应用[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年
5 赵艳杰;杨波;;基于数据挖掘的网络入侵检测系统的研究[A];山东省计算机学会2005年信息技术与信息化研讨会论文集(二)[C];2005年
6 曹雷;杜辉锋;;基于Web挖掘的个性化推荐模型的研究[A];全国第十届企业信息化与工业工程学术年会论文集[C];2006年
7 ;基于广义对话的Web用户的聚类(英文)[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
8 燕飞;张铭;谭裕韦;唐建;邓志鸿;;综合社会行动者兴趣和网络拓扑的社区发现方法[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
9 霍英;陈志刚;;结合地理位置与语义聚类的P2P叠加网构建[A];2010年全国开放式分布与并行计算机学术会议论文集[C];2010年
10 张相於;陈继东;李玉坤;孟小峰;;TEXEM:一种基于实体的邮件任务提取策略[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
中国博士学位论文全文数据库 前10条
1 张伟;基于WWW的聚类引擎研究[D];重庆大学;2003年
2 黄发良;Web信息网络社区挖掘的关键技术研究[D];华南理工大学;2011年
3 杨博;网格任务调度与优化机制研究[D];中南大学;2008年
4 白云;P2P环境中基于语义的资源自组织、发现及推荐研究[D];西南大学;2008年
5 褚瑞;基于虚拟计算环境的内存资源共享技术研究[D];国防科学技术大学;2007年
6 付剑锋;面向事件的知识处理研究[D];上海大学;2010年
7 钱卫宁;对等计算系统中的数据管理[D];复旦大学;2004年
8 张龙昌;面向复杂上下文的组合服务决策方法研究[D];北京邮电大学;2011年
9 王建荣;对等网络中的查询搜索机制与信任模型研究[D];天津大学;2009年
10 熊家军;基于数据挖掘的入侵检测关键技术研究[D];华中科技大学;2004年
中国硕士学位论文全文数据库 前10条
1 刘晓燕;基于聚类的入侵检测系统研究[D];青岛大学;2006年
2 张锦;关于一种混合式入侵检测系统的研究与设计[D];沈阳工业大学;2006年
3 杨德刚;基于数据挖掘的实时入侵检测技术研究[D];重庆大学;2004年
4 庞传军;基于聚类的复杂网络中社团发现算法的研究[D];青岛大学;2009年
5 张莹;基于数据挖掘技术降低入侵检测系统误报率的研究[D];山东大学;2005年
6 姚醒;基于数据挖掘的入侵检测未知攻击识别框架研究[D];浙江大学;2006年
7 林晨;异构环境下非结构化对等网络路由算法研究[D];同济大学;2006年
8 俞琰;基于隐马尔可夫模型的Web信息抽取研究[D];南京工业大学;2005年
9 刘震;分布式入侵检测的若干问题研究[D];汕头大学;2005年
10 张雪琼;基于博弈论的入侵检测系统[D];华中科技大学;2006年
中国重要报纸全文数据库 前4条
1 钟卫东;IPv6协议——下一代互联网的核心[N];人民邮电;2001年
2 主持人:徐勇;IPv6协议——下一代互联网的核心[N];人民邮电;2002年
3 汤大权 张维明 邓苏 肖卫东 李勇;主动信息服务[N];计算机世界;2001年
4 ;IPv6的寻址和路由方法[N];人民邮电;2001年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978