收藏本站
《第一届全国Web信息系统及其应用会议(WISA2004)论文集》2004年
收藏 | 手机打开
二维码
手机客户端打开本文

一种基于粗集与贝叶斯分类器的中文网页分类方法

张东娜  彭宏  吴铁峰  
【摘要】:本文针对网页分类问题提出一种结合粗集理论和贝叶斯分类器的方法。谊方法针对贝叶斯分类器存在的属性间独立性限制问题和在大量样本情况下的分类效率问题,采用粗集的属性约简方法对描述网页类别的特征向量空间进行了约简,改善了属性间的独立性限制,减少了属性的数量,再使用约简后的数据训练贝叶斯分类嚣,提高了贝叶斯分类器的性能。实验结果表明该方法用于网页分类问题具有较好效果。

手机知网App
【参考文献】
中国期刊全文数据库 前3条
1 都云琪,肖诗斌;基于支持向量机的中文文本自动分类研究[J];计算机工程;2002年11期
2 李晓黎,刘继敏,史忠植;基于支持向量机与无监督聚类相结合的中文网页分类器[J];计算机学报;2001年01期
3 宫秀军,史忠植;基于Bayes潜在语义模型的半监督Web挖掘[J];软件学报;2002年08期
【共引文献】
中国期刊全文数据库 前10条
1 马垣;基于二进制可辨矩阵的知识约简(续前)[J];鞍山师范学院学报;2003年04期
2 张巧艳;郑丽英;张晨阳;;粗集数据挖掘技术在市场营销中的应用[J];兵工自动化;2006年06期
3 ;A rough sets based pruning method for bagging ensemble[J];重庆邮电大学学报(自然科学版);2008年03期
4 马建斌;李滢;滕桂法;王芳;赵洋;;KNN和SVM算法在中文文本自动分类技术上的比较研究[J];河北农业大学学报;2008年03期
5 高波,眭莉;基于粗糙集的网页训练样本集的分类属性的选择[J];常州工学院学报;2004年02期
6 吴成东;许可;韩中华;裴涛;;基于粗糙集和决策树的数据挖掘方法[J];东北大学学报;2006年05期
7 孙铁利;赵隽;杨凤芹;吴迪;;一种基于相对特征的文本分类算法[J];东北师大学报(自然科学版);2010年01期
8 陈子军;王鑫昱;;基于网页特征的会话识别方法[J];燕山大学学报;2008年01期
9 丁志勇;杨苹;杨曦;张臻;;基于连续时间段聚类的支持向量机风电功率预测方法[J];电力系统自动化;2012年14期
10 朱江华;潘丰;;基于蚁群算法的粗糙集知识约简[J];东南大学学报(自然科学版);2005年S2期
中国重要会议论文全文数据库 前10条
1 朱江华;潘丰;;基于蚁群算法的粗糙集知识约简[A];2005年全国自动化新技术学术交流会论文集[C];2005年
2 王军霞;杨慧中;;应用遗传算法求解粗糙集的知识约简[A];2005中国控制与决策学术年会论文集(下)[C];2005年
3 董威;徐林;王建辉;顾树生;;一种离散粒子群算法在粗糙集知识约简中的应用[A];2005中国控制与决策学术年会论文集(下)[C];2005年
4 管红波;田大钢;杨保安;;基于遗传算法的粗糙集最佳约简算法[A];2006中国控制与决策学术年会论文集[C];2006年
5 朱江华;潘丰;;基于蚁群算法的粗糙集知识约简[A];2005全国自动化新技术学术交流会论文集(二)[C];2005年
6 彭怡;寇纲;;基于领域知识的数据挖掘理论框架研究[A];第三届(2008)中国管理学年会论文集[C];2008年
7 王兵;林涛;陈善本;;漏焊智能检测系统中的知识维护[A];第十次全国焊接会议论文集(第2册)[C];2001年
8 王世卫;李爱国;;报税欺诈检测研究[A];第三届全国信息获取与处理学术会议论文集[C];2005年
9 程静;邱玉辉;;Web Mining中的网页分类[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
10 李晓瑞;刘刚;张小平;张红云;马垣;;关系数据库中的属性约简[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
中国博士学位论文全文数据库 前10条
1 邓斌;B2C在线评论中的客户知识管理研究[D];电子科技大学;2010年
2 韩晓明;基于符号有向图和支持向量机的故障诊断方法的研究[D];太原理工大学;2011年
3 张丹;区域旱情中长期预报及农业干旱风险综合评价[D];大连理工大学;2011年
4 杨抒;基于WEB的林产品信息资源整合方法研究[D];北京林业大学;2011年
5 孙晶涛;基于内容的垃圾邮件过滤技术研究[D];兰州理工大学;2010年
6 王飞;入侵检测分类器设计及其融合技术研究[D];南京理工大学;2011年
7 邹长城;中国核电产业自主化发展研究[D];中南大学;2011年
8 刘宏兵;多目标粒度支持向量机及其应用研究[D];武汉理工大学;2011年
9 刘松华;核矩阵低秩分解与核空间信息能度量研究及应用[D];西安电子科技大学;2011年
10 刘笑嶂;核方法的若干关键问题研究及其在人脸图像分析中的应用[D];中山大学;2010年
中国硕士学位论文全文数据库 前10条
1 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
2 刘国峰;数据模板匹配研究及在社保审计中的应用[D];哈尔滨工程大学;2010年
3 张磊;基于支持向量机的反垃圾电话技术研究[D];哈尔滨工程大学;2010年
4 张峰;基于支持向量机的网站发布系统设计与实现[D];大连理工大学;2010年
5 徐晓丹;支持向量机在矿区遥感监测图像分类中的应用研究[D];辽宁工程技术大学;2009年
6 吕靖;互联网搜索词分类关键技术研究[D];浙江大学;2011年
7 赵鹏飞;基于在线生物医学文献构建MRI图像数据库的研究[D];浙江大学;2011年
8 梅铮;商业数据流降维方法及其聚类算法研究[D];浙江工商大学;2011年
9 石华;基于系统文件特征属性分析的计算机取证研究[D];大连交通大学;2010年
10 曹云生;基于支持向量机(SVM)的森林生态系统健康评价及预警[D];河北农业大学;2011年
【相似文献】
中国期刊全文数据库 前10条
1 马乐;翁智生;罗军;;一种基于SVM的网页层次分类算法[J];北京师范大学学报(自然科学版);2009年03期
2 刘晨曦;吴扬扬;;一种基于块分析的网页去噪音方法[J];广西师范大学学报(自然科学版);2007年02期
3 盛魁;赵鹏;;中文网页自动分类综述[J];电脑知识与技术;2010年27期
4 左敬龙;余桂兰;;具有量子特性的ACA-SVM网页分类方法[J];计算机工程与应用;2011年12期
5 兰均;施化吉;李星毅;徐敏;;基于特征词复合权重的关联网页分类[J];计算机科学;2011年03期
6 秦兵,郑实福,刘挺,张刚,李生;可分性判据在中文网页分类中的应用[J];微处理机;2002年01期
7 罗阳;季铎;张桂平;王莹莹;;面向单一双语网页的双语资源挖掘方法[J];中文信息学报;2011年01期
8 李明杰;;特征抽取方法在网页分类中的应用[J];常熟理工学院学报;2005年04期
9 齐宏卓;;浅谈网页模糊归类的应用[J];价值工程;2010年27期
10 鲁明羽,张红,付克明,陆玉昌;Web ME——一个大型网络挖掘环境系统[J];哈尔滨工业大学学报;2004年09期
中国重要会议论文全文数据库 前10条
1 张东娜;彭宏;吴铁峰;;一种基于粗集与贝叶斯分类器的中文网页分类方法[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
2 彭涛;左万利;赫枫龄;张长利;;基于粒子群优化算法的网页分类技术[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
3 熊琴;李陶深;陈燕;蒙辉;;NS2中选播通信模块的设计与实现[A];2007年全国开放式分布与并行计算机学术会议论文集(下册)[C];2007年
4 付焕焕;李俊;张洁;;入侵检测中机器学习算法的集成[A];中国电子学会第十七届信息论学术年会论文集[C];2010年
5 朱春江;陆宇旻;李陶深;杜衡斌;唐晟;;分布式网络监控系统中网页安全挖掘的研究[A];广西计算机学会2008年年会论文集[C];2008年
6 潘文锋;王斌;谭松波;;贝叶斯垃圾邮件过滤研究[A];全国网络与信息安全技术研讨会’2004论文集[C];2004年
7 万中英;王明文;廖海波;左家莉;;维数约简在网页分类中的应用[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
8 张迪;郑德权;赵铁军;于浩;;Blog网页分类与识别技术研究[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年
9 李婧;张焕国;;应用于贝叶斯过滤器的噪音消除算法研究[A];2005通信理论与技术新进展——第十届全国青年通信学术会议论文集[C];2005年
10 刘晓勇;;基于GA与SVM融合的网页分类算法[A];中国运筹学会模糊信息与模糊工程分会第五届学术年会论文集[C];2010年
中国重要报纸全文数据库 前10条
1 山枫;McAfee 用贝叶斯强化处理垃圾邮件[N];中国计算机报;2004年
2 ;神奇的贝叶斯邮件过滤器[N];网络世界;2003年
3 ;用智慧战胜垃圾邮件[N];网络世界;2003年
4 云南 张康宗;安全至上[N];电脑报;2003年
5 netloafer;主攻防“垃圾”技术[N];电脑报;2003年
6 张媛媛;网关级产品:三种模式按需选择[N];中国计算机报;2007年
7 ;反垃圾邮件 技术介绍和部署思路[N];中国电脑教育报;2005年
8 谭冬;反垃圾技术也会有误判与漏报[N];中国计算机报;2008年
9 乔珊;备份你的邮件过滤规则[N];电脑报;2004年
10 爱云;OE也能反垃圾邮件[N];电脑报;2004年
中国博士学位论文全文数据库 前10条
1 王飞;入侵检测分类器设计及其融合技术研究[D];南京理工大学;2011年
2 孙建涛;Web挖掘中的降维和分类方法研究[D];清华大学;2005年
3 李春艳;分级防火墙系统中动态访问控制技术研究[D];哈尔滨工程大学;2004年
4 潘志松;基于神经网络的入侵检测研究[D];南京航空航天大学;2003年
5 李丽娜;基于链接的网络数据分类和链接预测新方法研究[D];吉林大学;2012年
6 陈贞翔;具有规模适应性的互联网流量识别方法研究[D];山东大学;2008年
7 李战春;入侵检测中的机器学习方法及其应用研究[D];华中科技大学;2007年
8 惠孛;基于即时分类的垃圾邮件过滤关键技术的研究[D];电子科技大学;2009年
9 张长利;面向特定领域的互联网舆情分析技术研究[D];吉林大学;2011年
10 谭明锋;域间路由协议BGP-4健壮性测试技术的研究[D];国防科学技术大学;2005年
中国硕士学位论文全文数据库 前10条
1 黄伟杰;基于主动贝叶斯分类器检测未知恶意可执行代码的研究与实现[D];广西师范大学;2002年
2 伍菲;面向主题型的网页分类技术的研究与实现[D];华中科技大学;2011年
3 朱建建;非负矩阵分解及其在模糊网页分类中的应用[D];安徽大学;2012年
4 韩培培;网页分类及存储查询系统的设计及实现[D];燕山大学;2010年
5 吕婷婷;统计和规则相结合的新闻网页分类系统的设计与实现[D];电子科技大学;2011年
6 刘兰哲;企业搜索引擎中网页分类技术的研究与实现[D];东北大学;2008年
7 刘晨曦;网页去噪音与分类算法研究[D];华侨大学;2008年
8 黄美宁;基于用户行为分析的网页分类系统的研究与实现[D];北京邮电大学;2011年
9 王强;面向专业主题的网页分类算法研究[D];国防科学技术大学;2005年
10 汪光庆;基于SVM的网页分类技术研究[D];中国石油大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026