收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

一种基于Map Reduce的分布式文本数据过滤模型研究

李虎  邹鹏  贾焰  周斌  
【摘要】:该文首先介绍了文本过滤模型的特点以及发展状况。针对传统信息过滤处理方式无法满足现阶段海量数据环境下业务需求这一现状,该文提出了一种基于MapReduce框架的文本数据过滤模型,实现了传统的向量空间模型的分布式扩展。在实际环境中的测试表明,该模型的过滤精度和速度都较为理想,较好的满足了用户的需求。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 吕林涛;赵呈轩;尚进;杨宇祥;;基于高层语义视觉词袋的色情图像过滤模型[J];计算机应用;2011年07期
2 李虎;邹鹏;贾焰;周斌;;一种基于MapReduce的分布式文本数据过滤模型研究[J];信息网络安全;2011年09期
3 吴叶科;邬颖捷;宋如顺;陈波;;粗LVQ神经网络的垃圾邮件过滤[J];计算机工程与应用;2011年26期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
11 ;[J];;年期
12 ;[J];;年期
13 ;[J];;年期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 李虎;邹鹏;贾焰;周斌;;一种基于Map Reduce的分布式文本数据过滤模型研究[A];第26次全国计算机安全学术交流会论文集[C];2011年
2 李双龙;刘乐中;刘群;;利用单字碎片过滤改进汉语分词性能[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
3 石艳荣;孙丹宁;贺永强;;一种基于内容的邮件过滤模型的研究与性能分析[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
4 陈志文;姜建国;王开云;;网络入侵检测系统警报过滤算法设计[A];中国工程物理研究院科技年报(2005)[C];2005年
5 徐胜利;蔡园武;牛飞;程耿东;;拓扑优化中的体积守恒型密度过滤方法[A];中国力学学会学术大会'2009论文摘要集[C];2009年
6 张建锋;金同轨;王晓昌;;均质滤料滤层设计和操作的优化研究[A];中国土木工程学会水工业分会第四届理事会第一次会议论文集[C];2002年
7 李星民;郎兆新;;乳状液在多孔介质中的渗流及数值模拟[A];第五届全国水动力学学术会议暨第十五届全国水动力学研讨会文集[C];2001年
8 于静;赵燕平;;基于社会网络分析的BBS内容安全动态监测模型[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
9 马亮;陈群秀;谭伟;;智能Web信息检索相关研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
10 张承虎;潘亚文;庄兆意;孙德兴;;滤面水力连续再生装置技术原理与设计研究[A];全国暖通空调制冷2010年学术年会论文集[C];2010年
中国博士学位论文全文数据库 前4条
1 黄文良;垃圾短信过滤关键技术研究[D];浙江大学;2008年
2 杨绍媛;住房保障税收政策研究[D];山东大学;2008年
3 刘亚;熔喷/静电纺复合法聚乳酸非织造布的制备及过滤性能研究[D];天津大学;2009年
4 孙晶涛;基于内容的垃圾邮件过滤技术研究[D];兰州理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 吴静;基于过滤模型的上海市保障性住房供给研究[D];哈尔滨工业大学;2010年
2 吕伟初;移动多媒体邮件系统的应用安全性研究[D];南京理工大学;2004年
3 王影;BW-LVQ邮件过滤模型[D];电子科技大学;2005年
4 杜丽霞;廉租住房供给模式研究[D];贵州大学;2008年
5 赵海春;基于过滤模型对南京中低价住宅的研究[D];东南大学;2006年
6 刘智忠;管式连续微滤膜法处理热电厂循环冷却排污水过滤性能研究[D];华中科技大学;2008年
7 牛洪波;基于文本分类技术的信息过滤方法的研究[D];哈尔滨理工大学;2008年
8 张羽;基于支持向量机理论的垃圾邮件过滤模型[D];电子科技大学;2006年
9 王凤嫔;垃圾邮件的并行过滤模型及算法研究与实现[D];大庆石油学院;2007年
10 王志波;基于数据挖掘的垃圾邮件过滤技术研究[D];陕西师范大学;2009年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978