收藏本站
收藏 | 论文排版

基于主题词的网络热点话题发现

李恒训  张华平  秦鹏  于满泉  刘金刚  
【摘要】:网络话题层出不穷,往往会引发重大舆情危机,如何快速高效的从海量信息中发现热点是一重大挑战。本文提出了一种基于主题词的网络热点话题发现算法。其基本思想为:首先综合主题词表和有意义串识别结果生成主题词候选集;然后对候选集进行多重过滤并采用启发式规则对主题词进行权重计算;最后,以主题词为线索,采用多特征的话题模型,融合新闻、论坛、博客的相应特征实现了网络热点话题的发现。通过在TDT4评测语料和中科院计算所天玑舆情监测系统平台上的实验分别取得了0.282的最小识别代价和93.3%的用户满意度,算法运行效率高于传统方法。实验表明,该算法对网络热点话题发现行之有效。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 程涛;施水才;王霞;吕学强;;基于同义词词林的中文文本主题词提取[J];广西师范大学学报(自然科学版);2007年02期
2 龙志祎;程葳;;基于词聚类的热点话题检测算法[J];计算机工程与设计;2011年06期
3 曾依灵;许洪波;白硕;;网络文本主题词的提取与组织研究[J];中文信息学报;2008年03期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
11 ;[J];;年期
12 ;[J];;年期
13 ;[J];;年期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前1条
1 李恒训;张华平;秦鹏;于满泉;刘金刚;;基于主题词的网络热点话题发现[A];第五届全国信息检索学术会议论文集[C];2009年
中国硕士学位论文全文数据库 前4条
1 李楠;基于遗传算法的汉语文本主题词提取研究[D];吉林大学;2007年
2 唐培丽;基于语义的汉语文本主题词提取算法研究与实现[D];吉林大学;2005年
3 杨勇涛;WEB舆情观点挖掘关键技术研究[D];电子科技大学;2009年
4 宋洪鑫;基于标签与内容的blog检索实验系统研究与实现[D];北京邮电大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978