收藏本站
《2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)》2008年
收藏 | 手机打开
二维码
手机客户端打开本文

使用多层迭代分析和分类网页文档的方法

唐超  刘辰  杨正球  
【摘要】:文中提出了一种基于 FA(有限自动机)和 SVM(支持向量机)的网页自动分析分类方法。该方法通过构建一个多层次可迭代有限自动机,实现对网页的分析。并利用 LibSVM 工具提供的支持向量机多类分类功能,实现了网页的多类分类;为了提高分类的准确率,引入了一种基于关键词的网页向量生成算法。实验表明,它不仅具有较好的网页分析效果和较高的训练效率,同时能得到很高的分类精确率和召回率。

【参考文献】
中国期刊全文数据库 前4条
1 王茹,宋瀚涛,陆玉昌;基于树自动机的网页数据抽取[J];北京理工大学学报;2004年09期
2 王晓云;SVM算法分析与研究[J];渝西学院学报(自然科学版);2005年03期
3 程传鹏;李钜;;中文网页分类中特征提取的研究[J];中原工学院学报;2005年06期
4 程传鹏;;中文网页分类的研究与实现[J];中原工学院学报;2007年01期
【共引文献】
中国期刊全文数据库 前7条
1 张敏;;基于确定性树自动机技术的信息抽取研究[J];才智;2011年36期
2 张伟刚;陈军章;;人工免疫理论在网络文本分类中的应用研究[J];电脑知识与技术;2011年26期
3 吕英丽;徐小君;葛宇;;基于SVM算法的移动终端图像检索系统设计[J];河北建筑工程学院学报;2012年02期
4 吴繁;;谈多媒体的应用与日语教学的关系[J];黑龙江科技信息;2012年34期
5 谭鹏许;谭晓贞;张来顺;;基于无秩树自动机的信息抽取技术研究[J];计算机工程与设计;2009年23期
6 平凡;;基于工作流的自动化办公系统设计与应用[J];天津电大学报;2011年01期
7 黄莉;李湘东;;基于《中图法》的自动分类研究现状与展望[J];图书情报知识;2012年04期
中国博士学位论文全文数据库 前2条
1 孟大鹏;面向SCCW的核电装备制造企业供应风险评估与控制研究[D];哈尔滨工业大学;2011年
2 寇月;Deep Web实体搜索的关键技术研究[D];东北大学;2009年
中国硕士学位论文全文数据库 前10条
1 王乐超;Web环境下文献信息的提取与匹配研究[D];大连理工大学;2010年
2 孙尚白;基于小波变换的三维表面纹理超分辨率及评价[D];中国海洋大学;2010年
3 邸晓东;基于CT图像的孤立性肺结节诊断模型研究[D];哈尔滨理工大学;2010年
4 曹艳秋;基于全局运动方向的异常行为检测[D];兰州大学;2011年
5 刘晓彦;基于支持向量机的独立学院教学评价系统研究[D];吉林农业大学;2011年
6 饶平;多格式海量数据统一存取的效率优化[D];东北石油大学;2011年
7 朱坤红;基于VSM模型和特征选择算法的中文文本自动分类研究[D];江西师范大学;2011年
8 高保平;嵌入式字符识别技术的研究与开发[D];江南大学;2012年
9 卢睿;基于XML的Web信息抽取研究[D];大连海事大学;2005年
10 石宇;基于XML的Web信息抽取与集成技术的研究[D];大连海事大学;2006年
【相似文献】
中国期刊全文数据库 前10条
1 周志明,陈敏;支持向量机的人脸识别方法[J];咸宁学院学报;2003年03期
2 吴成东,杜崇峰,杨丽英;基于误差修正码的支持向量机大类别分类方法[J];沈阳建筑工程学院学报(自然科学版);2004年01期
3 张辉,张浩,陆剑峰;SVM在数据挖掘中的应用[J];计算机工程;2004年06期
4 李忠伟,张健沛,杨静,张福顺;基于支持向量机的虚拟企业伙伴选择方法研究[J];计算机应用研究;2004年12期
5 唐发明,王仲东,陈绵云;一种新的二叉树多类支持向量机算法[J];计算机工程与应用;2005年07期
6 王顺利;基于支持向量机(SVM)的图像去噪方法[J];微电子学与计算机;2005年04期
7 杨凌,刘玉树;基于支持向量机的坦克识别算法[J];影像技术;2005年02期
8 唐述敏,方景龙;基于支持向量机的人脸识别[J];计算机与数字工程;2005年07期
9 邓小文;支持向量机参数选择方法分析[J];福建电脑;2005年11期
10 李忠伟,张健沛,杨静;基于支持向量机的增量学习算法研究[J];哈尔滨工程大学学报;2005年05期
中国重要会议论文全文数据库 前10条
1 唐超;刘辰;杨正球;;使用多层迭代分析和分类网页文档的方法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
2 杨凌;刘玉树;;基于支持向量机的坦克识别算法[A];第三届全国数字成像技术及相关材料发展与应用学术研讨会论文摘要集[C];2004年
3 许建生;盛立东;;基于改进的支持向量机和BP神经网络的识别算法[A];第八届全国汉字识别学术会议论文集[C];2002年
4 常俊林;魏巍;梁君燕;;基于支持向量机的SURF改进算法[A];中国自动化学会控制理论专业委员会C卷[C];2011年
5 宋普云;沈雪勤;吴清;;一种改进的SMO算法[A];第六届全国计算机应用联合学术会议论文集[C];2002年
6 乔立岩;彭喜元;彭宇;;基于支持向量机的键盘密码输入异常检测方法研究[A];2004全国测控、计量与仪器仪表学术年会论文集(上册)[C];2004年
7 王晶;薛毅;;基于有效集法的改进支持向量机算法[A];2007中国控制与决策学术年会论文集[C];2007年
8 王伟强;付立波;高文;黄庆明;蒋树强;;一种基于笔画特征的叠加文字检测方法[A];全国网络与信息安全技术研讨会论文集(下册)[C];2007年
9 杨凌;刘玉树;;基于支持向量机的坦克识别算法[A];中国航空学会信号与信息处理专业全国第八届学术会议论文集[C];2004年
10 徐扬;陈实;田玉敏;;基于核主成分分析的步态识别[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
中国重要报纸全文数据库 前2条
1 清华大学 苏光大;非接触式人脸识别技术[N];计算机世界;2006年
2 ;选择合适的数据挖掘算法[N];计算机世界;2007年
中国博士学位论文全文数据库 前10条
1 燕忠;基于蚁群优化算法的若干问题的研究[D];东南大学;2005年
2 佟伟民;股指期货交易中操纵行为识别方法研究[D];哈尔滨工业大学;2008年
3 陈万海;基于支持向量机的超谱图像分类技术研究[D];哈尔滨工程大学;2008年
4 田江;基于支持向量机的孤立点检测方法研究[D];大连理工大学;2009年
5 秦玉平;基于支持向量机的文本分类算法研究[D];大连理工大学;2008年
6 何静媛;RNA二级结构预测算法的研究[D];重庆大学;2009年
7 李伦波;自然场景下交通标志的检测与分类算法研究[D];哈尔滨工业大学;2008年
8 陈宝文;蚁群优化算法在车辆路径问题中的应用研究[D];哈尔滨工业大学;2009年
9 王开义;基于支持向量机的农产品生产关键控制点发现研究[D];北京工业大学;2011年
10 沈传河;金融问题中的支持向量机应用研究[D];山东科技大学;2011年
中国硕士学位论文全文数据库 前10条
1 朱健康;基于支持向量机的音乐自动分类[D];天津大学;2010年
2 江锋;支持向量机在分类及人脸检测应用中的研究[D];南京理工大学;2003年
3 朱晓芳;基于支持向量机的田间杂草识别方法研究[D];江苏大学;2010年
4 车志富;基于支持向量机的行人检测[D];北京交通大学;2010年
5 黄文艳;支持向量机与指纹分类算法研究[D];河北工业大学;2003年
6 张楠;基于支持向量机的车牌汉字识别方法的研究[D];长春理工大学;2010年
7 吴惠雄;基于支持向量机与聚类算法的中文文本分类研究[D];中南林业科技大学;2009年
8 丁胜;基于支持向量机的手写体字符识别[D];青岛大学;2006年
9 蔡磊;SVM及其扩展算法在图像处理中的应用研究[D];西安石油大学;2010年
10 易潇;基于支持向量机的新闻自动分类技术的研究与应用[D];东北大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026