收藏本站
《NCIRCS2004第一届全国信息检索与内容安全学术会议论文集》 2004年
收藏 | 手机打开
二维码
手机客户端打开本文

维数约简在网页分类中的应用

万中英  王明文  廖海波  左家莉  
【摘要】:为了有效地组织Internet 网上极其丰富的信息资源,网页自动分类成为一个日益重要的研究领域。但目前的分类算法还存在一些不足,其主要原因之一就是特征空间的维数过高问题。本文介绍了主成分分析(Principle Component Analysis,PCA)、潜在语义索引(Latent Semantic Indexing,LSI)和投影寻踪(projection pursuit,PP)等维数约简方法,并对其应用于网页分类进行了比较。对比实验结果表明,这几种维数约简方法对网页分类都有较好的分类结果。从所降到的维数来看,投影寻踪方法将特征空间降到了超低维(一维),这不仅提高了数据的可视性,而且提高了分类速度。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 柯丽;王明文;何世柱;黎佳;罗远胜;;基于频率共现熵的跨语言网页自动分类研究[J];江西师范大学学报(自然科学版);2011年03期
2 楼文高;冯国珍;吴晓伟;乔龙;;基于竞争情报的企业竞争力投影寻踪实证建模[J];情报杂志;2011年09期
3 张安妮;姜华;郝相莲;;面向主题的快速搜索引擎的设计与研究[J];淮阴工学院学报;2011年03期
4 张云雷;周军;刘海霞;;一种基于DOM的Web关键信息提取方法[J];现代计算机;2011年06期
5 张永波;游录金;陈杰新;;基于模拟退火的多标记数据特征选择[J];计算机工程与设计;2011年07期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
11 ;[J];;年期
12 ;[J];;年期
13 ;[J];;年期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 万中英;王明文;廖海波;左家莉;;维数约简在网页分类中的应用[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
2 李立宇;唐世渭;杨冬青;叶恒强;王腾蛟;;COMMIX-Classifier—自动网页分类系统[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
3 彭涛;左万利;赫枫龄;张长利;;基于粒子群优化算法的网页分类技术[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
4 程静;邱玉辉;;Web Mining中的网页分类[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
5 王顺久;杨志峰;;生态环境质量综合评价的投影寻踪模型[A];科技、工程与经济社会协调发展——中国科协第五届青年学术年会论文集[C];2004年
6 刘后森;杨力行;魏俊智;苏枋;;牛网瓣口在体环向舒缩应变的PPR分析[A];“力学2000”学术大会论文集[C];2000年
7 车斌;;投影寻踪模型在区域水产养殖业竞争力评价中的应用[A];建设我国现代化农业的技术经济问题研究——中国农业技术经济研究会2007年学术研讨会论文集[C];2007年
8 段沛霞;李大鹏;倪长健;;区域农业生态环境质量综合评价投影寻踪动态聚类模型[A];第二届全国农业环境科学学术研讨会论文集[C];2007年
9 姜永生;李忠富;;我国35个大中城市居住水平动态综合评价实证研究[A];第十二届中国管理科学学术年会论文集[C];2010年
10 樊鸿伟;杨广林;王丽丽;;两种评价方法在玉米收获机械选型的评价研究[A];农业系统工程理论与实践研究——全国农业系统工程学术研讨会论文集[C];2006年
中国重要报纸全文数据库 前7条
1 边歆;越主动越安全[N];网络世界;2006年
2 王玉春 赵洪新;齐市检察院网络建设步伐快[N];黑龙江经济报;2008年
3 陈洪强;管理网页好帮手[N];中国电脑教育报;2002年
4 本报记者 边歆;让安全和应用更智能[N];网络世界;2010年
5 彭朝晖 稳捷网络大中国区总经理;电信应用安全的标准[N];网络世界;2010年
6 电脑商报记者 张戈;Blue Coat精确管理网络[N];电脑商报;2010年
7 ;上网行为管理产品选购指南之功能篇[N];网络世界;2011年
中国博士学位论文全文数据库 前10条
1 张连蓬;基于投影寻踪和非线性主曲线的高光谱遥感图像特征提取及分类研究[D];山东科技大学;2003年
2 王顺久;水资源开发利用综合研究[D];四川大学;2003年
3 孙建涛;Web挖掘中的降维和分类方法研究[D];清华大学;2005年
4 易尧华;基于投影寻踪的多(高)光谱影像分析方法研究[D];武汉大学;2004年
5 董四辉;水库防洪预报调度及灾情评价理论研究与应用[D];大连理工大学;2006年
6 金菊良;遗传算法在水资源工程中的应用研究[D];四川大学;2000年
7 史玉峰;数字信息模式识别理论及其应用[D];山东科技大学;2003年
8 路威;面向目标探测的高光谱影像特征提取与分类技术研究[D];中国人民解放军信息工程大学;2005年
9 朱军华;环境因素作用下的结构损伤检测[D];暨南大学;2011年
10 杜一平;化学数据挖掘新算法和定量构性关系基础研究[D];湖南大学;2002年
中国硕士学位论文全文数据库 前10条
1 韩培培;网页分类及存储查询系统的设计及实现[D];燕山大学;2010年
2 吕婷婷;统计和规则相结合的新闻网页分类系统的设计与实现[D];电子科技大学;2011年
3 伍菲;面向主题型的网页分类技术的研究与实现[D];华中科技大学;2011年
4 朱建建;非负矩阵分解及其在模糊网页分类中的应用[D];安徽大学;2012年
5 张云霞;投影寻踪小波神经网络及其应用的研究[D];西北工业大学;2002年
6 黄美宁;基于用户行为分析的网页分类系统的研究与实现[D];北京邮电大学;2011年
7 冀国光;基于投影寻踪的高速公路目标持续性综合评价研究[D];河北工程大学;2011年
8 刘兰晶;基于改进投影寻踪模型的施工项目管理的研究[D];河北工程大学;2011年
9 马志荣;小麦赤霉病预测模型研究[D];安徽农业大学;2010年
10 马森林;投影寻踪回归模型在林分出材率预测中的应用研究[D];福建农林大学;2010年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978