收藏本站
《第十八届全国数据库学术会议论文集(技术报告篇)》2001年
收藏 | 手机打开
二维码
手机客户端打开本文

Web Mining中的网页分类

程静  邱玉辉  
【摘要】:本文在总结传统的文本分类与Web Mining中的网页分类的区别的基础上,提出了一种将超链应用于网页分类的方法。我们定义了一种能够反应内容相关性的超链为father-son关系的超链,并提出了一种构造基于此关系的"超链树林"的算法,最后用实验说明本算法是有效的。
【作者单位】:重庆西南师范大学计算机与信息科学院
【分类号】:TP391.1

手机知网App
【参考文献】
中国期刊全文数据库 前5条
1 崔伟东,周志华,李星;支持向量机研究[J];计算机工程与应用;2001年01期
2 沈达阳;孙茂松;;万维网知识挖掘方法的研究[J];计算机科学;2000年02期
3 王实;高文;李锦涛;;Web数据挖掘[J];计算机科学;2000年04期
4 王伟强;高文;段立娟;;Internet上的文本数据挖掘[J];计算机科学;2000年04期
5 李晓黎,刘继敏,史忠植;基于支持向量机与无监督聚类相结合的中文网页分类器[J];计算机学报;2001年01期
【共引文献】
中国期刊全文数据库 前10条
1 苏发慧;;模糊支持向量机在粮食安全预警中的应用[J];安徽建筑工业学院学报(自然科学版);2009年02期
2 钟晓旭;胡学钢;;基于数据挖掘的Web招聘信息相关性分析[J];安徽建筑工业学院学报(自然科学版);2010年04期
3 宰松梅;贾艳辉;丁铁山;温季;郭冬冬;;基于最小二乘支持向量机的灌区粮食产量预测研究[J];安徽农业科学;2010年01期
4 邱荣芬;网络环境下信息的采取收集和分类整理——搜索引擎与收藏夹的应用[J];毕节师范高等专科学校学报(综合版);2001年03期
5 宋伟,王举成,马根峰,赵济林;Internet数据挖掘原理及实现[J];重庆邮电学院学报(自然科学版);2001年02期
6 王岚,张鹏祥;基于Web的数据挖掘研究[J];长春师范学院学报;2005年07期
7 范亚芹,刘颖,李兴男;Web数据挖掘原理及实现[J];吉林大学学报(信息科学版);2003年04期
8 刘洋;程礼;范家栋;;基于支持向量机的航空发动机滑油监控分析[J];长沙航空职业技术学院学报;2007年04期
9 卢咏;卢云;;基于WEB日志挖掘的旅游信息资源网站个性化研究[J];长沙铁道学院学报(社会科学版);2007年04期
10 高波,眭莉;基于粗糙集的网页训练样本集的分类属性的选择[J];常州工学院学报;2004年02期
中国重要会议论文全文数据库 前10条
1 吴静珠;刘翠玲;孙晓容;;支持向量机在近红外光谱检测技术中的应用研究[A];第二十九届中国控制会议论文集[C];2010年
2 师伟;廖闻剑;;数据挖掘在Web上的研究与应用[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
3 张东娜;彭宏;吴铁峰;;一种基于粗集与贝叶斯分类器的中文网页分类方法[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
4 李军;张云起;;运用支持向量机进行营销风险识别[A];中国企业运筹学[C];2009年
5 李优;;支持向量机在组块识别中的应用[A];第八届中国青年运筹信息管理学者大会论文集[C];2006年
6 周小平;晏蒲柳;;基于支持向量机的网络故障在线诊断方法研究[A];第九届全国青年通信学术会议论文集[C];2004年
7 王世卫;李爱国;;报税欺诈检测研究[A];第三届全国信息获取与处理学术会议论文集[C];2005年
8 施水才;肖诗斌;王弘蔚;王洪俊;苏东庄;;TRS中文文本信息检索技术的发展——从全文检索到基于自然语言处理的知识检索[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
9 孙丽华;肖诗斌;施水才;;基于向量空间模型的规则分类技术[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
10 李通;刘昌钰;唐常杰;左劼;于中华;;基于自然语言理解技术的Web文件分类与过滤[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
中国博士学位论文全文数据库 前10条
1 杨波;植物类中药寒热药性与化学成分相关性的文献研究[D];山东中医药大学;2010年
2 韩晓明;基于符号有向图和支持向量机的故障诊断方法的研究[D];太原理工大学;2011年
3 杨抒;基于WEB的林产品信息资源整合方法研究[D];北京林业大学;2011年
4 王飞;入侵检测分类器设计及其融合技术研究[D];南京理工大学;2011年
5 刘松华;核矩阵低秩分解与核空间信息能度量研究及应用[D];西安电子科技大学;2011年
6 刘笑嶂;核方法的若干关键问题研究及其在人脸图像分析中的应用[D];中山大学;2010年
7 杨旭;基于核方法的模式分类研究与应用[D];上海交通大学;2011年
8 梁海波;基于陀螺冗余的微惯性系统关键技术研究[D];哈尔滨工程大学;2011年
9 袁文华;高压共轨喷油系统多学科设计优化及智能控制研究[D];湖南大学;2010年
10 简(王争)峰;基于XML的异构产品信息网上交换、检索技术研究与应用[D];浙江大学;2002年
中国硕士学位论文全文数据库 前10条
1 韩微微;基于web日志的网络课程使用状况信息采集及评价的研究[D];哈尔滨师范大学;2010年
2 张磊;基于支持向量机的反垃圾电话技术研究[D];哈尔滨工程大学;2010年
3 孙原;基于酉变换的权威页面挖掘算法研究[D];哈尔滨工程大学;2010年
4 张峰;基于支持向量机的网站发布系统设计与实现[D];大连理工大学;2010年
5 徐晓丹;支持向量机在矿区遥感监测图像分类中的应用研究[D];辽宁工程技术大学;2009年
6 张艳杰;基于支持向量机的人力资源管理风险预测研究[D];河北工程大学;2010年
7 周绪倩;基于电子商务的Web数据挖掘系统架构研究[D];河北工程大学;2010年
8 钟冠群;聚类算法在B2M电子商务中的应用研究[D];长春工业大学;2010年
9 张鑫;基于支持向量机的能源管理系统短期负荷预测[D];长春工业大学;2010年
10 刘璐;基于支持向量机的精馏塔故障诊断研究[D];华东理工大学;2011年
【相似文献】
中国期刊全文数据库 前10条
1 陈益军;;一种基于元数据方法的KNN网页分类器的设计与实现[J];福建电脑;2007年06期
2 孙玲芳;黎维良;;基于定题爬虫的网页分类的多级判定算法[J];科学技术与工程;2009年18期
3 焦莉娟;冯丽萍;;Web页面分类中特征提取方法的改进[J];科技广场;2009年09期
4 张高胤;谭成翔;汪海航;;基于K-近邻算法的网页自动分类系统的研究及实现[J];计算机技术与发展;2007年01期
5 李军杰;刘克胜;赵有才;;基于改进kNN算法的网页分类系统设计[J];网络安全技术与应用;2007年11期
6 谭金波;;基于层次结构的网页自动分类系统的设计与实现[J];情报杂志;2009年06期
7 庞宁;杨尔弘;;网页文本分类中的特征选择研究[J];太原科技大学学报;2007年04期
8 甘新玲;鲁明羽;唐焕玲;李永;;面向循证医学网络文献的SVM分类方法[J];广西师范大学学报(自然科学版);2008年03期
9 童亚拉;陈益;;一种基于混沌粒子群算法的网页分类规则抽取方法[J];微电子学与计算机;2009年02期
10 宋军涛;杜庆灵;;基于改进蚁群算法和支持向量机的网页分类研究[J];电脑知识与技术;2009年35期
中国重要会议论文全文数据库 前10条
1 程静;邱玉辉;;Web Mining中的网页分类[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
2 李立宇;唐世渭;杨冬青;叶恒强;王腾蛟;;COMMIX-Classifier—自动网页分类系统[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
3 唐超;刘辰;杨正球;;使用多层迭代分析和分类网页文档的方法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
4 刘艳民;;中文网页分类方法的研究[A];2009年全国开放式分布与并行计算机学术会议论文集(下册)[C];2009年
5 程新荣;杨仁刚;;网页自动分类在搜索引擎上的应用研究[A];2007'中国仪器仪表与测控技术交流大会论文集(二)[C];2007年
6 董静;林鸿飞;杨志豪;;中文网页形式自动分类[A];第三届学生计算语言学研讨会论文集[C];2006年
7 张健沛;李连江;杨静;;个性化搜索引擎排序算法的研究与改进[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
8 米晓芳;秦洋;王立宏;宋宜斌;;基于潜在语义差异的医学网页分类[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
9 朱春江;陆宇旻;李陶深;杜衡斌;唐晟;;分布式网络监控系统中网页安全挖掘的研究[A];广西计算机学会2008年年会论文集[C];2008年
10 鲁力;莫夏丽;肖德强;郭承湘;曾高峰;李珲;李习艺;;中医食疗与药膳查询系统的建立与应用[A];中国营养学会第十次全国营养学术会议暨第七届会员代表大会论文摘要汇编[C];2008年
中国重要报纸全文数据库 前8条
1 楚培林;治疗IE6.0无法链接之伤[N];电脑报;2003年
2 广东省吴川市川西中学 高志华;Excel牵手IE[N];中国电脑教育报;2005年
3 范艳;办公小便笺[N];电脑报;2004年
4 本报记者 边歆;让安全和应用更智能[N];网络世界;2010年
5 静悄悄;让一张图片包含多个超链接[N];电脑报;2003年
6 山东 王兰富;小辞典[N];电脑报;2003年
7 阿@;Word 文档中的下划线[N];电脑报;2003年
8 严瑞;在一张图片上也能制作多个超级链接[N];江苏经济报;2003年
中国博士学位论文全文数据库 前5条
1 徐晴阳;基于关系子群发现算法的聚焦爬行技术[D];吉林大学;2008年
2 周翀;搜索引擎中文档聚类方法研究[D];华中科技大学;2009年
3 李晓黎;WEB信息检索与分类中的数据采掘研究[D];中国科学院研究生院(计算技术研究所);2001年
4 阎红灿;面向Web的XML文档数据管理及分类检索技术研究[D];天津大学;2009年
5 简(王争)峰;基于XML的异构产品信息网上交换、检索技术研究与应用[D];浙江大学;2002年
中国硕士学位论文全文数据库 前10条
1 丛艳;自动文本摘要方法的研究及应用[D];华北电力大学(北京);2004年
2 于成龙;中文网页分类及存储系统设计与实现[D];哈尔滨工业大学;2007年
3 庞雅丽;基于统计的中文新闻网页分类技术研究[D];西北师范大学;2007年
4 王晶;面向通信管理的电子政务系统及其网页分类的研究与实现[D];上海交通大学;2009年
5 王春龙;基于网站语义结构的信息抽取系统的研究与实现[D];北京交通大学;2007年
6 段昕;基于视觉特征中文网页分类方法的研究[D];山东大学;2007年
7 刘菁菁;基于结构和主题的Web信息检索研究[D];大连理工大学;2007年
8 谢光华;中文网页自动分类的研究及其应用[D];大连理工大学;2007年
9 徐法艳;基于Web挖掘技术的网页分类研究[D];扬州大学;2008年
10 朱珠;基于网页特征的中文网页自动分类问题研究[D];合肥工业大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026