收藏本站
《2006年全国开放式分布与并行计算学术会议论文集(一)》2006年
收藏 | 手机打开
二维码
手机客户端打开本文

基于支持向量机的Web文本分类方法

牛强  王志晓  陈岱  夏士雄  
【摘要】:Web文本分类技术是数据挖掘中一个研究热点领域,而支持向量机又是一种高效的分类识别方法,在解决高维模式识别问题中表现出许多特有的优势。文章通过分析Web文本的特点,研究了向量空间模型(VSM)的分类方法和核函数的选取,在此基础上结合决策树方法提出了一种基于决策树支持向量机的Web文本分类模型, 并给出具体的算法。通过实验测试表明,该方法训练数据规模大大减少,训练效率较高,同时具有较好的精确率 (90.11%)和召回率(89.38%)。

【参考文献】
中国期刊全文数据库 前3条
1 庞剑锋,卜东波,白硕;基于向量空间模型的文本自动分类系统的研究与实现[J];计算机应用研究;2001年09期
2 马笑潇,黄席樾,柴毅;基于SVM的二叉树多类分类算法及其在故障诊断中的应用[J];控制与决策;2003年03期
3 张学工;关于统计学习理论与支持向量机[J];自动化学报;2000年01期
【共引文献】
中国期刊全文数据库 前10条
1 陶秀凤,唐诗忠,周鸣争;基于支持向量机的软测量模型及应用[J];安徽工程科技学院学报(自然科学版);2004年02期
2 刘万春,罗双华,朱玉文,谢世斌;基于聚类分析和支持向量机的布匹瑕疵分类方法[J];北京理工大学学报;2004年08期
3 战守义,井新;加入时间因素的个性化信息过滤技术[J];北京理工大学学报;2005年09期
4 李宁;孙铭;王磊;刘兴龙;童隆正;;基于支持向量机的肝纤维化CT图像分类[J];北京生物医学工程;2007年01期
5 代劲;胡峰;王国胤;;基于不完备信息系统的文本分类研究与应用[J];重庆邮电学院学报(自然科学版);2006年03期
6 徐红敏;杨天行;;基于支持向量机分类算法的湖泊水质评价研究[J];吉林大学学报(地球科学版);2006年04期
7 汪丹,张亚非;SVM和BP算法在气体识别中的对比研究[J];传感技术学报;2005年01期
8 盛守照,王道波,黄向华,王志胜;新型前向神经网络设计方法在软测量中的应用[J];传感器技术;2004年04期
9 谭超;基于支持向量机的软测量技术及其应用[J];传感器技术;2005年08期
10 字正华;石庚辰;;基于自适应EIH模型的激波脉冲识别[J];测试技术学报;2006年01期
中国重要会议论文全文数据库 前10条
1 Bai Peng Liu Junhua School of electrical engineering,Xi'an Jiaotong University Xi'an,710049 China;Compensated Algorithm of Sensor Characteristic Based on Support Vector Machine[A];Proceedings of 6th International Symposium on Test and Measurement(Volume 4)[C];2005年
2 Zhao Shuanzhu Chen Junjie Guo Xin College of Computer and Software Taiyuan University of Technology,Taiyuan,Shanxi,Chnia,030024;Research on the Frame Structure and Its Implement of a Special Field-based Content Information Mining System on Web[A];Proceedings of 6th International Symposium on Test and Measurement(Volume 8)[C];2005年
3 邵信光;杨慧中;石晨曦;;ε不敏感支持向量回归在化工数据建模中的应用[A];江苏省自动化学会七届四次理事会暨2004学术年会青年学者论坛论文集[C];2004年
4 邵小健;段华;贺国平;;一种改进的最少核分类器[A];中国运筹学会第七届学术交流会论文集(上卷)[C];2004年
5 汤俊;肖健华;吴今培;;基于支持向量回归的商业银行信贷风险评估[A];中国运筹学会第八届学术交流会论文集[C];2006年
6 侯伟真;潘美芹;;高斯核支持向量机最优模型参数选择搜索算法[A];中国运筹学会第八届学术交流会论文集[C];2006年
7 李志明;孔令富;;用于回归估计的支持向量机[A];广西计算机学会2005年学术年会论文集[C];2005年
8 薛翠红;于明;;用于感兴趣区域图像编码的人脸特征的检测[A];全国第十届企业信息化与工业工程学术年会论文集[C];2006年
9 王薇;李晓辉;;CDMA系统中基于SVM的多用户检测算法[A];第十九届电工理论学术年会论文集[C];2007年
10 曹健;林涛;;电力系统谐波/间谐波高精度测量方法的比较研究[A];中南七省(区)电力系统专业委员会第二十二届联合学术年会论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 叶俊勇;人脸检测与识别方法研究[D];重庆大学;2002年
2 马笑潇;智能故障诊断中的机器学习新理论及其应用研究[D];重庆大学;2002年
3 夏建涛;基于机器学习的高维多光谱数据分类[D];西北工业大学;2002年
4 刘建胜;文档图象版面理解的研究[D];重庆大学;2002年
5 王源;不确定非线性系统的神经网络自适应重构控制[D];南京航空航天大学;2002年
6 吴涛;构造性知识发现方法研究[D];安徽大学;2003年
7 范昕炜;支持向量机算法的研究及其应用[D];浙江大学;2003年
8 陈定权;自动主题搜索的应用研究[D];中国科学院研究生院(文献情报中心);2003年
9 刘广利;基于支持向量机的经济预警方法研究[D];中国农业大学;2003年
10 吴涛;核函数的性质、方法及其在障碍检测中的应用[D];中国人民解放军国防科学技术大学;2003年
中国硕士学位论文全文数据库 前10条
1 屈炳云;移动通信中的多用户检测算法[D];西安电子科技大学;2001年
2 汪跃龙;基于神经网络模型的环氧乙烷反应器预测控制[D];西北工业大学;2001年
3 易靖;基于信息粒度原理的文本分类方法的研究[D];北京工业大学;2001年
4 钱小军;Web文本挖掘技术研究及其实现[D];浙江大学;2002年
5 忻栋;支持向量机算法的研究及在说话人识别上的应用[D];浙江大学;2002年
6 沈培华;支持矢量机的算法研究和应用[D];南京理工大学;2002年
7 陈红英;Internet信息过滤Agent的研究和实现[D];广东工业大学;2002年
8 张惠康;骨肿瘤辅助诊断专家系统的研究[D];第四军医大学;2002年
9 吴艳冬;复杂背景中的人脸检测与定位[D];大连理工大学;2002年
10 张红涛;储粮害虫图像识别中的特征抽取研究[D];郑州大学;2002年
【二级参考文献】
中国期刊全文数据库 前2条
1 耿遵敏,宋孔杰,李兆前,张兴华,万德玉;关于柴油机振声特点及动态诊断方法的研究与讨论[J];内燃机学报;1995年02期
2 卢增祥,李衍达;交互支持向量机学习算法及其应用[J];清华大学学报(自然科学版);1999年07期
中国博士学位论文全文数据库 前1条
1 马笑潇;智能故障诊断中的机器学习新理论及其应用研究[D];重庆大学;2002年
【相似文献】
中国期刊全文数据库 前10条
1 胡洋;吴黎慧;高磊;蒲南江;;基于SVM的语音情感识别研究[J];电子测试;2011年09期
2 蒋强荣;高远;张鸿宾;;基于直方图交核的人脸识别[J];北京工业大学学报;2011年08期
3 赵立志;李辉;陈海东;魏士勇;;支持向量机在说话人识别系统中的应用[J];China's Foreign Trade;2011年14期
4 王雪松;高阳;程玉虎;;基于随机子空间-正交局部保持投影的支持向量机[J];电子学报;2011年08期
5 刘健;刘忠;;基于小波变换和支持向量机的水下目标分类方法[J];火力与指挥控制;2011年09期
6 石铁峰;;支持向量机在电子邮件分类中的应用研究[J];计算机仿真;2011年08期
7 木塔力甫·沙塔尔;李春庚;艾斯卡尔·艾木都拉;安居白;;基于可训练机制的联机维吾尔手写字母识别技术研究[J];计算机应用与软件;2011年09期
8 李志敏;张慧;古利超;;应用两级分类实现车牌字符识别[J];电子技术应用;2011年04期
9 施建宇;雷朝霞;方智裕;;利用灰度纹理分析方法识别蛋白质空间结构[J];计算机工程与应用;2011年20期
10 肖永良;夏利民;;基于核的监督非保局投影镜头边界检测[J];控制工程;2011年04期
中国重要会议论文全文数据库 前10条
1 郭小荟;马小平;;基于EMD近似熵特征提取和支持向量机的故障诊断方法[A];中国自动化学会控制理论专业委员会D卷[C];2011年
2 朱晓霞;孙同景;陈桂友;;基于支持向量机理论的两级指纹分类实现方法[A];第16届中国过程控制学术年会暨第4届全国故障诊断与安全性学术会议论文集[C];2005年
3 蔡蕾;朱永生;;基于稀疏性非负矩阵分解和支持向量机的轴心轨迹图识别[A];2008年全国振动工程及应用学术会议暨第十一届全国设备故障诊断学术会议论文集[C];2008年
4 牛强;王志晓;陈岱;夏士雄;;基于支持向量机的Web文本分类方法[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年
5 罗云林;徐文君;;基于支持向量机的航空发动机内窥损伤识别[A];2006中国控制与决策学术年会论文集[C];2006年
6 徐继伟;李建中;柳勃;杨昆;;使用支持向量机和改进特征提取方法的蛋白质分类[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
7 郭相科;刘进忙;曹学斌;张玉鹏;;子类独立分量分析在声目标识别中的应用[A];中国声学学会2007年青年学术会议论文集(上)[C];2007年
8 李泽辉;聂生东;陈兆学;;应用多类SVM分割MR脑图像特征选择与优化的实验研究[A];中国仪器仪表学会第九届青年学术会议论文集[C];2007年
9 詹玉龙;刘明明;李邦辉;;基于支持向量机的船用主柴油机气缸盖故障诊断[A];第十五届全国大功率柴油机学术会议论文集[C];2007年
10 李巍华;刘雯;;基于主元分析和直推式支持向量机的齿轮早期故障诊断[A];第十二届全国设备故障诊断学术会议论文集[C];2010年
中国重要报纸全文数据库 前10条
1 燕海霞;王忆勤;李福凤;脉象信号研究日渐深入[N];中国医药报;2005年
2 沈占锋;遥感影像信息提取与分析[N];计算机世界;2006年
3 王竣;深入开发CAD系统对疾病诊断有重要意义[N];中国医药报;2007年
4 北京数码空间信息技术有限公司技术总监 刘斌;Web Mining:第二代网络信息处理技术[N];计算机世界;2000年
5 课题主持人 李心丹 课题协调人 上海证券交易所 施东晖 傅浩 课题研究员 宋素荣 查晓磊 宾红辉 张许宏 郭静静 黄隽 南京大学工程管理学院;内幕交易与市场操纵的行为动机与判别监管研究[N];中国证券报;2007年
6 孙哲南 谭铁牛;生物识别的十大关键技术[N];计算机世界;2007年
7 上海 高博;让电脑“听懂”人话[N];电脑报;2008年
8 记者 何腾江 通讯员 周汇成;验钞新技术通过鉴定[N];中山日报;2008年
9 李水根;计算机详解配伍与药效关系[N];健康报;2005年
10 清华大学 苏光大;非接触式人脸识别技术[N];计算机世界;2006年
中国博士学位论文全文数据库 前10条
1 孙蕾;医学图像智能挖掘关键技术研究[D];西北大学;2005年
2 唐静远;模拟电路故障诊断的特征提取及支持向量机集成方法研究[D];电子科技大学;2010年
3 吴婷;自发脑电脑机接口模式识别关键技术与实验研究[D];上海交通大学;2008年
4 张超;基于支持向量机的汽轮机轴系振动故障智能诊断研究[D];华北电力大学(河北);2009年
5 周喜川;非可信环境下的支持向量机研究[D];浙江大学;2010年
6 蒋永华;旋转机械非平稳信号微弱特征提取方法研究[D];重庆大学;2010年
7 冯坤;基于内积变换的机械故障特征提取原理与早期识别方法研究[D];北京化工大学;2012年
8 赵海滨;脑—机接口的特征提取和分类方法研究[D];东北大学;2009年
9 翟永杰;基于支持向量机的故障智能诊断方法研究[D];华北电力大学(河北);2004年
10 杜小芳;基于CPFR的农产品采购模型研究[D];华中科技大学;2005年
中国硕士学位论文全文数据库 前10条
1 陈卫;基于支持向量机的说话人识别系统研究[D];华北电力大学(河北);2005年
2 陈军;基于支持向量机的脱机手写体汉字识别方法的研究[D];合肥工业大学;2006年
3 任爽;基于XML和SVM的Web文本挖掘研究[D];大连理工大学;2006年
4 唐孝;支持向量机(SVM)及其在心电图(ECG)分类识别中的应用[D];四川师范大学;2007年
5 王晓晶;支持向量机在脑功能模式识别和分类中的研究[D];天津师范大学;2009年
6 张淼;基于支持向量机的文本分类系统研究[D];大庆石油学院;2008年
7 周辉;齿轮故障的特征提取与模式识别技术研究[D];郑州大学;2005年
8 朱丹红;数字图书馆基于内容的图像检索技术的研究[D];福州大学;2006年
9 赵智超;基于数据挖掘的沙尘暴智能预报系统的研究[D];天津大学;2005年
10 乔素娟;基于SVM的中文垃圾邮件的识别研究[D];山西财经大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026