收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于LDA模型的博客垃圾评论发现

刁宇峰  林鸿飞  
【摘要】:Blog(博客)作为一种新兴的网络媒体,在很大程度上增强了互联网的开放性,Blog已经成为互联网上的主要信息源之一,这也使得Blog空间中的垃圾评论成倍增长。本文首先利用处理垃圾邮件的方法,针对Blog本身的特点,使用规则初步过滤垃圾评论,然后对剩余评论,利用LatentDirichletAllocation(LDA)这种能够提取文本隐含主题的产生式模型,对博客中的博文进行主题提取,并结合主题信息进行判断,从而得到垃圾评论。经验证,该方法可以发现大多数垃圾评论,实验取得了较好的结果,使Blog信息更加准确、有效的为用户使用。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张颖;;试论图书馆blog网站建设[J];福建电脑;2009年03期
2 OKBOY;Wallop探秘[J];个人电脑;2005年04期
3 贝林峰;;网络博客交互信息应用研究[J];硅谷;2008年11期
4 孙志国;Blog,知识共享与个人知识管理[J];农业网络信息;2004年10期
5 蓝颖;网上思想交流的栖息地[J];新电脑;2004年06期
6 陆伟,魏泉,寇广增;基于Blog的网络信息组织[J];情报科学;2005年02期
7 柳清;新一代的网络交流方式!走上博客(Blog)之路[J];网络与信息;2005年02期
8 ;建造Blog[J];个人电脑;2003年08期
9 武金刚;小武爬网之网上写日记[J];电脑校园;2005年05期
10 ;环球观察[J];电子商务世界;2002年10期
11 徐涌,燕辉;博客与BBS的差异研究[J];现代情报;2005年05期
12 杨晓辉;;基于Blog的知识管理[J];现代教育技术;2006年06期
13 刘艳;;图书馆Blog的应用现状及展望[J];科技情报开发与经济;2006年18期
14 孙莉;浅谈Blog的应用[J];大众科技;2005年07期
15 马培锋,李建生,王伟清,张进良;Blog在个人知识管理中的应用初探[J];湘潭师范学院学报(社会科学版);2005年03期
16 缪宏;;发挥Blog在校本研究中的平台作用[J];软件导刊;2005年12期
17 王志军;;体验迅雷资源博客[J];电脑迷;2006年18期
18 杨丽娜;;BLOG在大学生个人知识管理中的应用研究[J];计算机与信息技术;2008年09期
19 流言;;嘿,想不想知道谁在看你的博客?[J];电脑爱好者;2009年16期
20 张晨逸;孙建伶;丁轶群;;基于MB-LDA模型的微博主题挖掘[J];计算机研究与发展;2011年10期
中国重要会议论文全文数据库 前10条
1 刁宇峰;林鸿飞;;基于LDA模型的博客垃圾评论发现[A];第六届全国信息检索学术会议论文集[C];2010年
2 樊旺斌;刘正捷;陈东;张海昕;;博客服务系统用户行为研究——用户访谈[A];第二届和谐人机环境联合学术会议(HHME2006)——第2届中国人机交互学术会议(CHCI'06)论文集[C];2006年
3 毕景刚;韩颖;;班级Blog在亲师沟通中的应用研究[A];Proceedings of 2011 National Teaching Seminar on Cryptography and Information Security(NTS-CIS 2011) Vol.1[C];2011年
4 郑阳梅;;Blog与教学整合的模式及策略探究[A];信息技术环境构建与教学应用[C];2009年
5 苗家;马军;陈竹敏;;一种基于HITS算法的blog文摘方法[A];第六届全国信息检索学术会议论文集[C];2010年
6 张怡;侯文君;;基于ACSI模型的微博客用户满意度评价研究[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【poster】[C];2011年
7 毛伟众;;报业网站架构若干概念与实践[A];中国新闻技术工作者联合会五届一次理事会暨学术年会论文集(上篇)[C];2009年
8 宋洪鑫;李蕾;刘冬雪;;中文博客标签调查分析及标签推荐模型的研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
9 刘秉权;李博;孙林;王宝勋;刘远超;;标签特征和正文特征融合的SVM博客文本分类算法研究[A];第六届全国信息检索学术会议论文集[C];2010年
10 牛星;;看我国SNS社交网站现状与趋势[A];计算机研究新进展(2010)——河南省计算机学会2010年学术年会论文集[C];2010年
中国博士学位论文全文数据库 前2条
1 李思;WEB观点挖掘中关键问题的研究[D];北京邮电大学;2012年
2 肖宇;校园网络信息传播特性与用户影响力研究[D];华中科技大学;2012年
中国硕士学位论文全文数据库 前10条
1 周振宇;基于LDA的微博与传统媒体的话题对比研究[D];上海交通大学;2013年
2 闫泽华;基于LDA的新闻线索抽取研究[D];上海交通大学;2012年
3 谢英香;博客网络位置影响力测评研究[D];扬州大学;2010年
4 邓冰娜;面向博客的垃圾评论识别方法研究[D];河北大学;2011年
5 杨冠超;微博客热点话题发现策略研究[D];浙江大学;2011年
6 高晖吉;基于博文分布特征的博客精选技术研究[D];北京邮电大学;2010年
7 李金生;基于PHP的博客系统[D];吉林大学;2009年
8 谭庆华;赣县中学博客网页建设初探[D];江西师范大学;2005年
9 朴星海;面向主题的网络爬行器相关技术研究[D];哈尔滨工业大学;2007年
10 郭振强;微博客的多重性应用研究与交互设计[D];北京邮电大学;2011年
中国重要报纸全文数据库 前10条
1 caocao;优化你的博客网页[N];电脑报;2005年
2 天津 武金刚;让博客登录我的MSN[N];电脑报;2005年
3 见习记者 杨力叶;桂林博客:心灵行吟在山水之间[N];桂林日报;2007年
4 边路;让RSS走进你的MSN[N];电脑报;2005年
5 咕咚;Blog: 从技术出发[N];计算机世界;2003年
6 曹江华;搭建Linux下的博客网站[N];计算机世界;2006年
7 肖遥;四大漏洞将毁灭博客[N];电脑报;2005年
8 爱上一条鱼;水手日记 online[N];中国电脑教育报;2004年
9 义川;Web 2.0又没戏了?[N];网络世界;2006年
10 ;Web2.0在企业中悄悄成长[N];网络世界;2007年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978