收藏本站
《第三届全国信息检索与内容安全学术会议论文集》2007年
收藏 | 手机打开
二维码
手机客户端打开本文

一种多过滤器集成学习垃圾邮件过滤方法

刘伍颖  王挺  
【摘要】:垃圾邮件过滤就是在线对邮件做出 Spam(垃圾)或 Ham(非垃圾)的判断,这是一种根据客户反馈不断自学习的过程。本文通过抽取邮件的语言特征和行为特征构建多个简单过滤器, 然后采用集成学习方法组合这些简单过滤器,获得了比简单过滤器更高的性能。实验表明单一特征学习的计算复杂性低、速度较快,而集成学习的效果更好。本文提出的将 SVM 集成学习用于邮件过滤的方法,在各种集成学习方法中效果最好。

手机知网App
【引证文献】
中国期刊全文数据库 前2条
1 张艳秋;王蔚;;利用遗传算法优化的支持向量机垃圾邮件分类[J];计算机应用;2009年10期
2 马海群;赵建平;傅荣贤;张峰;;中国大陆信息检索领域研究热点及内容分析——基于全国信息检索学术会议论文的计量统计[J];新世纪图书馆;2012年06期
【共引文献】
中国期刊全文数据库 前7条
1 薛冰;郭晓松;蒲鹏程;;人脸识别技术综述[J];四川兵工学报;2010年07期
2 寇继虹;楼雯;;基于知识图谱的E-learning研究的可视化分析[J];电化教育研究;2011年09期
3 李晗静;李生;赵铁军;韩延海;叶利军;李理;;基于自然语言理解的实体自动摆放的研究[J];电子与信息学报;2007年08期
4 孔琳俊;陈松;;数字化校园环境下异构数据映射维护关键技术分析[J];软件;2011年06期
5 晏春,倪青山,杜耀华,王正志;基于改进的Winnow算法的剪接位点识别[J];生命科学研究;2005年03期
6 侯传宇;;隐含概念漂移的数据流分类算法研究[J];宿州学院学报;2008年02期
7 李鸿彬;林浒;杨雪华;林荣;;一种基于社会网络的SIP垃圾即时消息的检测方法[J];小型微型计算机系统;2012年08期
中国重要会议论文全文数据库 前5条
1 刘子豪;庄毅;;一种电子邮件敏感信息检测算法[A];第八届全国信息隐藏与多媒体安全学术大会湖南省计算机学会第十一届学术年会论文集[C];2009年
2 赵林;夏迎炬;黄萱菁;吴立德;;基于Winnow算法的文本过滤[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
3 潘文锋;王斌;于满泉;谭松波;;Winnow算法在垃圾邮件过滤中的应用[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
4 赵纪元;李晗静;赵铁军;;汉语空间关系中射体识别问题的研究与分析[A];第三届学生计算语言学研讨会论文集[C];2006年
5 陆玉清;洪宇;陆军;姚建民;朱巧明;;基于上下文的真词错误检查及校对方法[A];第六届全国信息检索学术会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 李全彬;非约束环境下人脸识别关键技术的研究与应用[D];华东师范大学;2011年
2 刘伍颖;面向垃圾信息过滤的主动多域学习文本分类方法研究[D];国防科学技术大学;2011年
3 赵强利;基于选择性集成的在线机器学习关键技术研究[D];国防科学技术大学;2010年
4 陈元;基于分类模型的知识发现过程研究[D];国防科学技术大学;2002年
5 夏迎炬;文本过滤关键技术研究[D];复旦大学;2003年
6 邹涛;智能网络入侵检测系统关键技术研究[D];国防科学技术大学;2004年
7 丁连红;基于信息流的个性化服务研究[D];中国科学院研究生院(计算技术研究所);2006年
8 曹渝昆;基于神经网络和模糊逻辑的智能推荐系统研究[D];重庆大学;2006年
9 叶施仁;海量数据约简与分类研究[D];中国科学院研究生院(计算技术研究所);2001年
10 吴丽辉;个性化的Web信息采集技术研究[D];中国科学院研究生院(计算技术研究所);2005年
中国硕士学位论文全文数据库 前10条
1 张丽;无标注自学习反垃圾邮件服务的研究[D];中国海洋大学;2010年
2 苏保君;在线组合分类器应用于大规模垃圾邮件过滤的研究[D];浙江大学;2010年
3 殷贤君;基于增量存储的商业数据流分类挖掘算法研究与应用[D];浙江工商大学;2011年
4 王坤朋;基于指数梯度更新的支持向量机算法[D];西安电子科技大学;2011年
5 钱力思;基于AdaBoost人脸检测算法的研究[D];西南大学;2011年
6 周骥;在线学习及其在智能交通与金融工程中的应用[D];复旦大学;2011年
7 王舟;面向论坛信息文本的有效数据抽取研究[D];华中科技大学;2011年
8 刘学刚;基于DFS的概念学习机制研究[D];苏州大学;2011年
9 邓少鹍;几种人脸检测方法的研究[D];南京理工大学;2003年
10 戴声扬;基于新的相似度量和相关反馈算法的图象检索系统[D];清华大学;2004年
【同被引文献】
中国重要会议论文全文数据库 前7条
1 钟涛;陈群秀;;基于层式有限状态自动机的灾难事件抽取系统[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
2 陈华;梁循;阮进;;网络与舆情关联分析系统的设计实现[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
3 曾依灵;许洪波;白硕;;改进的OPTICS算法及其在文本聚类中的应用[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
4 章成志;;基于机器学习的文本聚类描述算法研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
5 孙忠贵;陈杰;孙玉珍;张义宁;;一种基于小波和Hough变换的仿射不变性商标检索[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
6 高杨;王向东;钱跃良;刘群;;基于音频重复性的广告检测[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
7 高鹏;梁家恩;王晓瑞;徐波;;一个面向海量视音频应用的快速关键音检索系统[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
【二级引证文献】
中国期刊全文数据库 前5条
1 孙凯;田国清;田宏;段文超;田洋;陈立军;;基于IGA-SVM的汽轮机故障诊断研究[J];东北电力大学学报;2012年03期
2 李松;顾巧论;高铁杠;;信息嵌入位置自适应选择的鲁棒水印算法[J];计算机应用;2013年02期
3 杨柳松;何光宇;;基于改进粒子群优化的SVM故障诊断方法[J];计算机工程;2013年03期
4 李庆诚;王聪;张金;;邮件协议在资源交换中可行性的研究与实现[J];计算机工程与设计;2012年02期
5 魏瑞斌;;基于微软学术搜索的信息检索研究的文献计量分析[J];图书情报工作;2012年20期
中国重要会议论文全文数据库 前2条
1 周红标;;基于小波包变换和最小二乘支持向量机的癫痫脑电信号识别[A];中国自动化学会控制理论专业委员会C卷[C];2011年
2 王琦;;基于贝叶斯决策树算法的垃圾邮件识别机制[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
中国博士学位论文全文数据库 前1条
1 闫嘉;基于电子鼻技术的人体伤口感染检测系统构建及算法研究[D];重庆大学;2012年
中国硕士学位论文全文数据库 前4条
1 王华;基于遗传支持向量机的传感器非线性校正方法[D];兰州理工大学;2011年
2 苗建;基于支持向量机的煮沸温度预测函数控制的应用研究[D];青岛科技大学;2010年
3 杨华;基于图片特征和分类器融合的垃圾邮件过滤技术研究[D];天津理工大学;2012年
4 王鹏;基于语义体与文本聚类的中文垃圾邮件过滤方法研究[D];兰州理工大学;2012年
【相似文献】
中国期刊全文数据库 前10条
1 陈华;魏连;郑志娴;许榕生;;基于集成学习的网络取证模型[J];福建电脑;2007年10期
2 刘郁,陈耘志,张兵;图像挖掘中利用类特征集成的自动学习算法研究[J];电脑知识与技术;2005年30期
3 张翔;周明全;董丽丽;闫清波;;结合粗糙集与集成学习的中文文本分类方法研究[J];计算机应用与软件;2011年01期
4 胡彩霞;;利用决策树获取搜索结果页面中的匹配数[J];科技咨询导报;2007年06期
5 阎巍;;基于决策树的软件项目估算方法[J];计算机工程与科学;2009年08期
6 王鹏鸣;;垃圾邮件过滤中潜在语义索引的应用[J];郑州大学学报(理学版);2010年02期
7 凌祺,樊孝忠;领域词汇自动获取的研究[J];微机发展;2005年08期
8 陈立孚,周宁,李丹;基于机器学习的自动文本分类模型研究[J];现代图书情报技术;2005年10期
9 刘解放;侯振雨;吴亮;;支持向量回归及其在农产品成分分析中的应用[J];广东农业科学;2007年12期
10 金澎;;词义消歧和词义消歧评测简介[J];术语标准化与信息技术;2010年03期
中国重要会议论文全文数据库 前10条
1 刘伍颖;王挺;;一种多过滤器集成学习垃圾邮件过滤方法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
2 李月伦;常宝宝;;基于最大间隔马尔可夫网模型的汉语分词方法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
3 谢世朋;胡茂林;;基于局部仿射区域对稀疏纹理分类的研究[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
4 夏诏杰;郭力;李晓霞;;化学主题网络爬虫的研究[A];第十届全国计算(机)化学学术会议论文摘要集[C];2009年
5 杜晓凤;丁友东;;FloatBag选择性神经网络集成及其在人脸检测中的应用[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
6 张燕;张付志;;跨系统个性化服务方法和用户模型研究[A];第三届和谐人机环境联合学术会议(HHME2007)论文集[C];2007年
7 宋普云;沈雪勤;吴清;;一种改进的SMO算法[A];第六届全国计算机应用联合学术会议论文集[C];2002年
8 陈文亮;朱靖波;姚天顺;张宇新;;基于Bootstrapping的领域词汇自动获取[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
9 汤俊;;自适应反洗钱辅助信息系统开发框架设计[A];第10届计算机模拟与信息技术会议论文集[C];2005年
10 冯元勇;孙乐;张大鲲;李文波;;基于单字提示特征的中文命名实体识别快速算法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国重要报纸全文数据库 前10条
1 本报记者 余建斌;机器学习与互联网搜索[N];人民日报;2011年
2 本报记者 张晔通讯员 李玮;周志华:永不墨守成规[N];科技日报;2008年
3 记者 刘垠;首届中美视觉夏令营开营[N];大众科技报;2009年
4 上海交通大学APEX数据和知识管理实验室 王昊奋俞勇;语义Web推动下一代搜索[N];计算机世界;2007年
5 涂序彦 陈泓娟;在网络信息海洋中淘金[N];计算机世界;2001年
6 王惠临;意义计算研究的兴起与发展[N];中国社会科学院报;2009年
7 易必特;数据仓库与电信行业决策支持(上)[N];人民邮电;2001年
8 孙哲南 谭铁牛;生物识别:未来安全之星[N];计算机世界;2006年
9 ;搜索引擎将引入人工智能技术[N];人民邮电;2006年
10 孙;"生物信息处理专用计算机与算法研究" 通过验收[N];计算机世界;2005年
中国博士学位论文全文数据库 前10条
1 方育柯;集成学习理论研究及其在个性化推荐中的应用[D];电子科技大学;2011年
2 刘长安;基于实例归纳的工艺规划方法及集成CAPP系统研究[D];山东大学;2003年
3 易勇;计算机辅助诗词创作中的风格辨析及联语应对研究[D];重庆大学;2005年
4 徐海祥;基于支持向量机方法的图像分割与目标分类[D];华中科技大学;2005年
5 牛晓太;多模式智能谈判支持系统的理论与方法研究[D];武汉大学;2004年
6 张丽新;高维数据的特征选择及基于特征选择的集成学习研究[D];清华大学;2004年
7 向坚;基于三维捕获数据的人体运动分析关键技术研究[D];浙江大学;2007年
8 文学志;基于机器学习的路面对象识别关键技术研究[D];东北大学;2008年
9 刘华文;基于信息熵的特征选择算法研究[D];吉林大学;2010年
10 艾解清;双边多议题自动协商研究[D];浙江大学;2011年
中国硕士学位论文全文数据库 前10条
1 张家红;集成分类学习算法研究[D];山东师范大学;2011年
2 李杉;选择性聚类集成算法研究[D];山东师范大学;2010年
3 刘孟旭;基于EP的多分类器表决分类算法[D];郑州大学;2004年
4 张金伟;基于Agent网络答疑系统的设计与实现[D];华东师范大学;2006年
5 赵万鹏;基于Adaboost算法的数字识别技术的研究与应用[D];中国科学院研究生院(成都计算机应用研究所);2006年
6 黄际洲;聊天机器人知识库自动抽取算法的研究与实现[D];重庆大学;2006年
7 孟祥山;工作流流程优化技术的应用研究[D];国防科学技术大学;2004年
8 唐雅媛;基于本体的试卷自动生成系统研究[D];中南大学;2009年
9 周荣鹏;生物医学文献中命名实体的识别[D];大连理工大学;2009年
10 张若峰;基于实例的文本自动分类技术的研究与实现[D];吉林大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026