收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于字符语言模型的垃圾邮件过滤

苏绥  林鸿飞  叶正  
【摘要】:基于内容的过滤是当前解决垃圾邮件问题的主流技术之一。本文先简单综述了当前基于内容的垃圾邮件过滤中采用的各种技术,在此基础上提出将基于字符的语言模型应用于垃圾邮件过滤任务中,并通过实验对比了该方法与Nave Bayes、SVM和基于词的语言模型方法的性能差异,以及不同n值、不同特征选择方式对过滤结果的影响。实验结果表明,基于字符的语言模型实现简单且具有很高的性能,能较好的满足大规模在线邮件系统的需要,具有很高的实用价值。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 刘茜;;SIGIR最新研究动向分析[J];图书馆学研究;2007年02期
2 陈世立;高野军;;基于神经网络与贝叶斯的混合文本分类研究[J];情报杂志;2007年05期
3 张俊林,孙乐,孙玉芳;基于主题语言模型的中文信息检索系统研究[J];中文信息学报;2005年03期
4 李生;赵铁军;周明;王跃进;邱祥辉;;机器翻译语言模型的探讨[J];情报科学;1989年03期
5 孙坦;周静怡;;近几年来国外信息检索模型研究进展[J];图书馆建设;2008年03期
6 邢美凤;过仕明;;文本内容新颖性探测研究综述[J];情报科学;2011年07期
7 章舜仲;王树梅;黄河燕;陈肇雄;;基于属性相关性分析的贝叶斯分类模型[J];情报学报;2007年02期
8 贺前华;徐秉铮;;机器翻译综述[J];情报科学;1993年04期
9 雷雪;;分布式检索中信息集选择方法研究综述[J];情报科学;2008年02期
10 屈鹏;李璐;张丽丽;;情报检索发展的几个前沿问题[J];图书情报工作;2008年03期
11 陆宝益,陆宝忠;论跨语言网络信息检索技术系统:以Mulinex为例[J];情报科学;2001年08期
12 陈海英,于金辉;利用语音识别进行信息检索[J];情报学报;2003年01期
13 曹树金,杨涛;自动分类在搜索引擎性能优化中的应用[J];情报科学;2004年02期
14 王斌;;从信息检索到搜索引擎[J];术语标准化与信息技术;2009年04期
15 赵蓉英;王菊;;国际信息检索模型研究的可视化分析[J];图书情报工作;2010年18期
16 刘峰,韩咏,李晓红;基于相邻实词关系的汉语信息检索[J];自动化技术与应用;2005年03期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前2条
1 苏绥;林鸿飞;叶正;;基于字符语言模型的垃圾邮件过滤[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
2 韩咏;孙育华;张帆;齐浩亮;;科技论文原创性检查系统的研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
中国博士学位论文全文数据库 前1条
1 王修力;基于描述复杂性的信息检索理论与若干模型研究[D];北京语言大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978