收藏本站
《第三届全国信息检索与内容安全学术会议论文集》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

一种多过滤器集成学习垃圾邮件过滤方法

刘伍颖  王挺  
【摘要】:垃圾邮件过滤就是在线对邮件做出 Spam(垃圾)或 Ham(非垃圾)的判断,这是一种根据客户反馈不断自学习的过程。本文通过抽取邮件的语言特征和行为特征构建多个简单过滤器, 然后采用集成学习方法组合这些简单过滤器,获得了比简单过滤器更高的性能。实验表明单一特征学习的计算复杂性低、速度较快,而集成学习的效果更好。本文提出的将 SVM 集成学习用于邮件过滤的方法,在各种集成学习方法中效果最好。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 陈华;魏连;郑志娴;许榕生;;基于集成学习的网络取证模型[J];福建电脑;2007年10期
2 刘郁,陈耘志,张兵;图像挖掘中利用类特征集成的自动学习算法研究[J];电脑知识与技术;2005年30期
3 张翔;周明全;董丽丽;闫清波;;结合粗糙集与集成学习的中文文本分类方法研究[J];计算机应用与软件;2011年01期
4 胡彩霞;;利用决策树获取搜索结果页面中的匹配数[J];科技咨询导报;2007年06期
5 阎巍;;基于决策树的软件项目估算方法[J];计算机工程与科学;2009年08期
6 王鹏鸣;;垃圾邮件过滤中潜在语义索引的应用[J];郑州大学学报(理学版);2010年02期
7 凌祺,樊孝忠;领域词汇自动获取的研究[J];微机发展;2005年08期
8 陈立孚,周宁,李丹;基于机器学习的自动文本分类模型研究[J];现代图书情报技术;2005年10期
9 刘解放;侯振雨;吴亮;;支持向量回归及其在农产品成分分析中的应用[J];广东农业科学;2007年12期
10 金澎;;词义消歧和词义消歧评测简介[J];术语标准化与信息技术;2010年03期
11 陈九昌;孔芳;朱巧明;周国栋;;指代消解中代词待消解项识别研究[J];计算机应用与软件;2011年03期
12 张仰森;郭江;;四种统计词义消歧模型的分析与比较[J];北京信息科技大学学报(自然科学版);2011年02期
13 刘庆波,洪家荣,王开铸;手写汉字识别中的机器学习[J];计算机研究与发展;1993年08期
14 韩世欣,黄梯云,李一军;基于机器学习理论的智能决策支持系统模型操纵方法的研究[J];管理科学学报;1996年01期
15 孙微微,田绪红,刘才兴;基于增益得分的噪声发现算法[J];计算机工程与应用;2005年21期
16 巨同升;机器学习在汉字智能拼音输入中的应用[J];山东理工大学学报(自然科学版);2005年03期
17 赵志升;罗德林;李海英;;数据挖掘技术与应用[J];河北北方学院学报(自然科学版);2006年06期
18 张高胤;谭成翔;汪海航;;基于K-近邻算法的网页自动分类系统的研究及实现[J];计算机技术与发展;2007年01期
19 凌霄汉;吉根林;;一种基于聚类集成的无监督特征选择方法[J];南京师范大学学报(工程技术版);2007年03期
20 何召卫;陈俊亮;;基于本体关系匹配的信息抽取[J];计算机工程;2007年21期
中国重要会议论文全文数据库 前10条
1 刘伍颖;王挺;;一种多过滤器集成学习垃圾邮件过滤方法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
2 李月伦;常宝宝;;基于最大间隔马尔可夫网模型的汉语分词方法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
3 谢世朋;胡茂林;;基于局部仿射区域对稀疏纹理分类的研究[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
4 夏诏杰;郭力;李晓霞;;化学主题网络爬虫的研究[A];第十届全国计算(机)化学学术会议论文摘要集[C];2009年
5 杜晓凤;丁友东;;FloatBag选择性神经网络集成及其在人脸检测中的应用[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
6 张燕;张付志;;跨系统个性化服务方法和用户模型研究[A];第三届和谐人机环境联合学术会议(HHME2007)论文集[C];2007年
7 宋普云;沈雪勤;吴清;;一种改进的SMO算法[A];第六届全国计算机应用联合学术会议论文集[C];2002年
8 陈文亮;朱靖波;姚天顺;张宇新;;基于Bootstrapping的领域词汇自动获取[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
9 汤俊;;自适应反洗钱辅助信息系统开发框架设计[A];第10届计算机模拟与信息技术会议论文集[C];2005年
10 冯元勇;孙乐;张大鲲;李文波;;基于单字提示特征的中文命名实体识别快速算法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 方育柯;集成学习理论研究及其在个性化推荐中的应用[D];电子科技大学;2011年
2 刘长安;基于实例归纳的工艺规划方法及集成CAPP系统研究[D];山东大学;2003年
3 易勇;计算机辅助诗词创作中的风格辨析及联语应对研究[D];重庆大学;2005年
4 徐海祥;基于支持向量机方法的图像分割与目标分类[D];华中科技大学;2005年
5 牛晓太;多模式智能谈判支持系统的理论与方法研究[D];武汉大学;2004年
6 张丽新;高维数据的特征选择及基于特征选择的集成学习研究[D];清华大学;2004年
7 向坚;基于三维捕获数据的人体运动分析关键技术研究[D];浙江大学;2007年
8 文学志;基于机器学习的路面对象识别关键技术研究[D];东北大学;2008年
9 刘华文;基于信息熵的特征选择算法研究[D];吉林大学;2010年
10 艾解清;双边多议题自动协商研究[D];浙江大学;2011年
中国硕士学位论文全文数据库 前10条
1 张家红;集成分类学习算法研究[D];山东师范大学;2011年
2 李杉;选择性聚类集成算法研究[D];山东师范大学;2010年
3 刘孟旭;基于EP的多分类器表决分类算法[D];郑州大学;2004年
4 张金伟;基于Agent网络答疑系统的设计与实现[D];华东师范大学;2006年
5 赵万鹏;基于Adaboost算法的数字识别技术的研究与应用[D];中国科学院研究生院(成都计算机应用研究所);2006年
6 黄际洲;聊天机器人知识库自动抽取算法的研究与实现[D];重庆大学;2006年
7 孟祥山;工作流流程优化技术的应用研究[D];国防科学技术大学;2004年
8 唐雅媛;基于本体的试卷自动生成系统研究[D];中南大学;2009年
9 周荣鹏;生物医学文献中命名实体的识别[D];大连理工大学;2009年
10 张若峰;基于实例的文本自动分类技术的研究与实现[D];吉林大学;2005年
中国重要报纸全文数据库 前10条
1 本报记者 余建斌;机器学习与互联网搜索[N];人民日报;2011年
2 本报记者 张晔通讯员 李玮;周志华:永不墨守成规[N];科技日报;2008年
3 记者 刘垠;首届中美视觉夏令营开营[N];大众科技报;2009年
4 上海交通大学APEX数据和知识管理实验室 王昊奋俞勇;语义Web推动下一代搜索[N];计算机世界;2007年
5 涂序彦 陈泓娟;在网络信息海洋中淘金[N];计算机世界;2001年
6 王惠临;意义计算研究的兴起与发展[N];中国社会科学院报;2009年
7 易必特;数据仓库与电信行业决策支持(上)[N];人民邮电;2001年
8 孙哲南 谭铁牛;生物识别:未来安全之星[N];计算机世界;2006年
9 ;搜索引擎将引入人工智能技术[N];人民邮电;2006年
10 孙;"生物信息处理专用计算机与算法研究" 通过验收[N];计算机世界;2005年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978