收藏本站
《全国第八届计算语言学联合学术会议(JSCL-2005)论文集》2005年
收藏 | 手机打开
二维码
手机客户端打开本文

基于多策略优化的分治多层聚类算法的话题发现研究

骆卫华  于满泉  许洪波  王斌  程学旗  
【摘要】:话题发现与跟踪是一项评测驱动的研究,旨在依据事件对语言文本信息流进行组织利用。自1996年提出以来。该研究得到了越来越广泛的关注。本文在研究已有成熟算法的基础上,针对其不足,提出了基于分治多层聚类的话题发现算法。基于该算法的系统在TDT4中文语料上进行了测试,结果表明该算法属于目前结果最好的算法之一,并显著降低了算法的时间和空间复杂度。

【引证文献】
中国期刊全文数据库 前3条
1 潘文富;郭友实;;网络舆情监测技术研究综述[J];福建电脑;2011年08期
2 陈学昌;韩佳珍;魏桂英;;话题识别与跟踪技术发展研究[J];中国管理信息化;2011年09期
3 熊志斌;王冬;尹成国;;舆情监测技术及应用综述[J];软件;2012年12期
中国博士学位论文全文数据库 前1条
1 刘玉国;基于内容的互联网舆情信息挖掘关键技术研究[D];山东大学;2011年
【参考文献】
中国重要会议论文全文数据库 前1条
1 骆卫华;刘群;程学旗;;话题检测与跟踪技术的发展与研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
【共引文献】
中国期刊全文数据库 前7条
1 焦健;瞿有利;;知网的话题更新与跟踪算法研究[J];北京交通大学学报;2009年05期
2 仓玉;洪宇;姚建民;朱巧明;;基于时序话题模型的新事件检测[J];智能计算机与应用;2011年03期
3 方莹,葛寒松;基于聚类的分级信息抽取方法初探[J];电脑知识与技术;2005年30期
4 仲兆满;刘宗田;李存华;;事件本体模型及事件类排序[J];北京大学学报(自然科学版);2013年02期
5 张欣;;中文Blog热门话题检测技术研究[J];软件导刊;2011年09期
6 张阔;李涓子;吴刚;王克宏;;基于词元再评估的新事件检测模型[J];软件学报;2008年04期
7 王卫姣;;话题追踪技术研究综述[J];软件导刊;2013年04期
中国重要会议论文全文数据库 前3条
1 张辉;李国辉;陈俊;;一种基于新闻要素建模的新事件探测方法[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【oral】[C];2011年
2 邱立坤;程葳;龙志祎;孙娇华;;面向BBS的话题挖掘初探[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
3 李军;李涓子;;新闻专题内子话题划分[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
中国博士学位论文全文数据库 前5条
1 张晓艳;新闻话题表示模型和关联追踪技术研究[D];国防科学技术大学;2010年
2 于满泉;面向人物追踪的知识挖掘研究[D];中国科学院研究生院(计算技术研究所);2006年
3 洪宇;基于语义结构和时序特征的话题检测与跟踪技术研究[D];哈尔滨工业大学;2009年
4 付剑锋;面向事件的知识处理研究[D];上海大学;2010年
5 田野;基于微博平台的事件趋势分析及预测研究[D];武汉大学;2012年
中国硕士学位论文全文数据库 前10条
1 印文涛;基于星型K部图的网络视频话题挖掘和可视化的研究[D];浙江大学;2011年
2 孙胜平;中文微博客热点话题检测与跟踪技术研究[D];北京交通大学;2011年
3 王甲坤;基于互联网的话题分类及敏感话题发现技术研究与实现[D];电子科技大学;2011年
4 张鹏飞;WEB挖掘技术在网络警情监控中的应用研究[D];华北电力大学;2011年
5 王岩;基于共现链的微博情感分析技术的研究与实现[D];国防科学技术大学;2011年
6 李婷玉;基于语义的文本事件信息抽取方法的研究与实现[D];上海交通大学;2012年
7 周淑贤;基于SVM的新闻报道特征新事件检测研究[D];中南林业科技大学;2011年
8 郭建永;聚类分析在文本挖掘中的应用与研究[D];江南大学;2008年
9 焦健;基于知网和话题更新的话题跟踪算法研究[D];北京交通大学;2009年
10 王巍;基于关键词和时间点的网络话题演化分析[D];复旦大学;2009年
【同被引文献】
中国期刊全文数据库 前10条
1 税仪冬;瞿有利;黄厚宽;;周期分类和Single-Pass聚类相结合的话题识别与跟踪方法[J];北京交通大学学报;2009年05期
2 何友全;徐澄;徐小乐;唐华姣;;一种基于统计学特征和DOM树的网页去噪技术[J];重庆理工大学学报(自然科学版);2011年01期
3 王春梅;;基于Bloom Filter的网络爬虫URL消重算法研究[J];产业与科技论坛;2011年18期
4 ;Genetic Feature Selection for Texture Classification[J];Geo-Spatial Information Science;2004年03期
5 鲁明羽;姚晓娜;魏善岭;;基于模糊聚类的网络论坛热点话题挖掘[J];大连海事大学学报;2008年04期
6 吴昊;耿焕同;;基于潜在语义分析的BBS主题发现算法研究[J];电脑知识与技术;2008年29期
7 苏国荣;杨岳湘;邓劲生;;一种去除重复URL的算法[J];广西师范大学学报(自然科学版);2010年01期
8 毛先领;何靖;闫宏飞;;网页去噪:研究综述[J];计算机研究与发展;2010年12期
9 熊德兰;程菊明;田胜利;;基于HowNet的句子褒贬倾向性研究[J];计算机工程与应用;2008年22期
10 张靖;金浩;;汉语词语情感倾向自动判断研究[J];计算机工程;2010年23期
中国重要会议论文全文数据库 前2条
1 时达明;林鸿飞;;基于内容相关度和语义分析的Blog热点话题发现[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
2 李思;张浩;徐蔚然;郭军;;基于合并模型的中文文本情感分析[A];第五届全国信息检索学术会议论文集[C];2009年
中国硕士学位论文全文数据库 前6条
1 姚漫;基于文本聚类的网页消重算法研究[D];北京交通大学;2008年
2 张超;文本倾向性分析在舆情监控系统中的应用研究[D];北京邮电大学;2008年
3 王桂梅;主题网络爬虫关键技术研究[D];哈尔滨工业大学;2009年
4 杜一平;主题搜索网络爬虫的设计与研究[D];中国科学技术大学;2009年
5 王征;基于布隆过滤器算法的网页消重技术的实现与应用[D];北京交通大学;2010年
6 庞俊;基于确定话题和情感极性的博客文本聚类研究[D];武汉理工大学;2010年
【二级引证文献】
中国期刊全文数据库 前3条
1 肖晨阳;;一种互联网舆情监控软件实现[J];电脑知识与技术;2012年34期
2 曾阳素;刘水强;伍雁鹏;雷军程;;对高校网络舆情系统建设的几点思考[J];邵阳学院学报(自然科学版);2012年04期
3 郭林宇;戚亚梅;李艳;廉亚丽;李祥洲;;农产品质量安全网络舆情监测工作的几点思考[J];中国食物与营养;2012年12期
中国博士学位论文全文数据库 前1条
1 万源;基于语义统计分析的网络舆情挖掘技术研究[D];武汉理工大学;2012年
中国硕士学位论文全文数据库 前1条
1 陈今园;非理性网络舆情在高校的影响及对策研究[D];福建师范大学;2012年
【相似文献】
中国期刊全文数据库 前10条
1 郑可锋;改进的系统聚类程序设计和应用简介[J];计算机与农业;1996年01期
2 田纪春,陈德富,庞祥梅;系统聚类方法及其计算机程序在农业生产中的应用[J];农业系统科学与综合研究;1994年02期
3 吴庄胜;用欧几里德距离进行系统聚类研究零件成组[J];成组技术与生产现代化;1988年05期
4 刘夫涛,张雷,艾波;多重系统聚类挖掘算法及其实现[J];计算机工程与应用;2000年10期
5 邱立坤;龙志祎;钟华;程葳;;层次化话题发现与跟踪方法及系统实现[J];广西师范大学学报(自然科学版);2007年02期
6 高妮;周明全;耿国华;王学松;贺毅岳;;基于文本挖掘的话题发现技术[J];计算机工程;2009年19期
7 屈喜琴;陈忠贵;;基于系统聚类的矿产储量研究[J];能源研究与管理;2011年02期
8 浦志伟;朱裕生;;寻根聚类法[J];物探化探计算技术;1991年02期
9 林贤明,李堂秋,史晓东;基于模板的机器翻译系统中模板库的自动构建技术[J];计算机应用;2004年09期
10 袁清珂,赵汝嘉,段福兴,车军;系统聚类分析方法与分类布点决策的研究[J];农业工程学报;1995年01期
中国重要会议论文全文数据库 前1条
1 骆卫华;于满泉;许洪波;王斌;程学旗;;基于多策略优化的分治多层聚类算法的话题发现研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
中国硕士学位论文全文数据库 前4条
1 韩小斌;面向藏文WEB热点事件发现系统的设计[D];西北民族大学;2012年
2 郑曼;基于SAS系统的税务数据挖掘研究[D];郑州大学;2012年
3 易慧;数据挖掘在移动通信中的应用[D];吉林大学;2007年
4 孙爱娜;城市路网交叉口检测器布设优化方法研究[D];大连海事大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026