收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于机器学习的非话题性博文过滤技术

张晨露  黄九鸣  朱湘  
【摘要】:随着在线社交网络的高速发展,在线社交网络分析成为当今研究热点。Twitter作为全球最具影响力的微博平台,吸引了大量学者进行研究。然而,Twitter中包含了大量的噪声,为了提高各种社交网络分析系统的性能,作为个性化信息推荐、地震预测、舆情监控等系统的前期工作,本文旨在识别出Twitter中的非话题性博文,过滤Twitter中的噪声。本文从博文的社交、词汇、文本3个方面抽取特征,运用机器学习技术,训练分类器用以识别非话题性博文。本系统的准确率达到了86%,召回率达到了87%,有效地提高了个性化信息推荐、地震预测、舆情监控等系统的运行效果。

知网文化
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978