收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

中文网页分类方法的研究

刘艳民  
【摘要】:实现了一个中文网页采集、过滤和分类系统.文中从网页预处理、特征选择、分类器模型等方面介绍了该系统的具体解决方案.实验结果表明,该分类系统取得了令人满意的分类效果.

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 贾志洋;李伟伟;高炜;夏幼明;;基于支持向量机的搜索引擎垃圾网页检测研究[J];云南民族大学学报(自然科学版);2011年03期
2 傅向华;刘国;陈冬剑;;一种核心子集选择训练的大规模中文网页分类方法[J];小型微型计算机系统;2011年08期
3 张安妮;姜华;郝相莲;;面向主题的快速搜索引擎的设计与研究[J];淮阴工学院学报;2011年03期
4 江小平;李成华;向文;张新访;;云计算环境下朴素贝叶斯文本分类算法的实现[J];计算机应用;2011年09期
5 魏蕾如;;基于搜索引擎的网络中文信息检索工具评价[J];数字技术与应用;2011年06期
6 张云雷;周军;刘海霞;;一种基于DOM的Web关键信息提取方法[J];现代计算机;2011年06期
7 刘劲松;张彬;柴文磊;魏建行;刘振鹏;;校园网园区搜索引擎的设计与实现[J];河北大学学报(自然科学版);2011年04期
8 张永波;游录金;陈杰新;;基于模拟退火的多标记数据特征选择[J];计算机工程与设计;2011年07期
9 ;[J];;年期
10 ;[J];;年期
11 ;[J];;年期
12 ;[J];;年期
13 ;[J];;年期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 刘艳民;;中文网页分类方法的研究[A];2009年全国开放式分布与并行计算机学术会议论文集(下册)[C];2009年
2 李立宇;唐世渭;杨冬青;叶恒强;王腾蛟;;COMMIX-Classifier—自动网页分类系统[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
3 张东娜;彭宏;吴铁峰;;一种基于粗集与贝叶斯分类器的中文网页分类方法[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
4 彭涛;左万利;赫枫龄;张长利;;基于粒子群优化算法的网页分类技术[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
5 董静;林鸿飞;杨志豪;;中文网页形式自动分类[A];第三届学生计算语言学研讨会论文集[C];2006年
6 程静;邱玉辉;;Web Mining中的网页分类[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
7 秦兵;郑实福;刘挺;张刚;李生;;基于改进的贝叶斯模型的中文网页分类器[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
8 薛长勇;;营养相关网络资源简介[A];2009年国家级继续医学教育项目临床营养新进展培训班论文集[C];2009年
9 万中英;王明文;廖海波;左家莉;;维数约简在网页分类中的应用[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
10 张迪;郑德权;赵铁军;于浩;;Blog网页分类与识别技术研究[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年
中国博士学位论文全文数据库 前7条
1 蒋昌金;基于关键词提取的中文网页自动文摘方法研究[D];华南理工大学;2010年
2 孙建涛;Web挖掘中的降维和分类方法研究[D];清华大学;2005年
3 徐晴阳;基于关系子群发现算法的聚焦爬行技术[D];吉林大学;2008年
4 李晓黎;WEB信息检索与分类中的数据采掘研究[D];中国科学院研究生院(计算技术研究所);2001年
5 周翀;搜索引擎中文档聚类方法研究[D];华中科技大学;2009年
6 阎红灿;面向Web的XML文档数据管理及分类检索技术研究[D];天津大学;2009年
7 吴广潮;基于聚类特征树的大规模分类算法研究[D];华南理工大学;2012年
中国硕士学位论文全文数据库 前10条
1 韩培培;网页分类及存储查询系统的设计及实现[D];燕山大学;2010年
2 吕婷婷;统计和规则相结合的新闻网页分类系统的设计与实现[D];电子科技大学;2011年
3 伍菲;面向主题型的网页分类技术的研究与实现[D];华中科技大学;2011年
4 朱建建;非负矩阵分解及其在模糊网页分类中的应用[D];安徽大学;2012年
5 赵翔;基于Web挖掘的中医知识发现研究[D];北京交通大学;2010年
6 黄美宁;基于用户行为分析的网页分类系统的研究与实现[D];北京邮电大学;2011年
7 刘娇;排序学习中的中文网页特征提取方法[D];哈尔滨工业大学;2009年
8 谷峰;中文网页层次分类研究[D];华侨大学;2007年
9 朱珠;基于网页特征的中文网页自动分类问题研究[D];合肥工业大学;2009年
10 于成龙;中文网页分类及存储系统设计与实现[D];哈尔滨工业大学;2007年
中国重要报纸全文数据库 前10条
1 陈翔;趋势科技:近十万中文网页遭入侵[N];中国计算机报;2008年
2 洪达;雅虎中国尝鲜“宝贝鱼”[N];民营经济报;2006年
3 本报记者 侯继勇 刘涓涓;百度解密:李彦宏背后的蜘蛛侠[N];21世纪经济报道;2005年
4 李彦宏;让中文在网络世界影响更大[N];人民日报;2006年
5 记者 史芳;雅虎搜索出山了[N];中国经济导报;2005年
6 赵明;张朝阳,从眼球回到技术[N];中国经济时报;2006年
7 赵垒;中文搜索引擎再点硝烟[N];中华工商时报;2006年
8 本报记者 关桂峰;“人立方”红遍互联网 勿成恶搞助推器[N];经济参考报;2008年
9 天津 武金刚;豆仔热线[N];电脑报;2003年
10 井之;全面了解网络浏览器(一)[N];网络世界;2001年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978