收藏本站
《第十六届全国青年通信学术会议论文集(上)》2011年
收藏 | 手机打开
二维码
手机客户端打开本文

一种基于支持向量机的多国语言文本分类平台

卢卫雄  
【摘要】:针对大批量文本的分类处理要求快速、高准确率的情况,本文提出了一种预处理文本信息方法,然后利用LIBSVM软件环境实现文本自动分类的平台。同时预处理阶段搭配不同语言的字典,实现多国语言文本的分类功能。该方法将文本转换为软件平台能读取的数据进行处理,方法简单快捷。同时通过选择合适的核函数和进行交叉验证等方法寻求最优参数,避免出现欠学习、过学习问题。最后通过使用关键词字典以及示例标准文本库进行分类操作,验证了平台分类的效率。
【作者单位】:北方工业大学
【分类号】:TP391.1

【参考文献】
中国期刊全文数据库 前2条
1 张海军;王学军;;基于RBF核函数支持向量机分类器的多导脑电信号分类识别研究[J];机电工程技术;2008年08期
2 鲁松,李晓黎,白硕,王实;文档中词语权重计算方法的改进[J];中文信息学报;2000年06期
【共引文献】
中国期刊全文数据库 前10条
1 宋涛;施水才;房祥;吕学强;;基于改进的潜在语义分析的文本聚类[J];北京信息科技大学学报(自然科学版);2012年03期
2 刘光远;董立岩;苑森淼;李永丽;刘辉;;基于位差的属性选择算法[J];吉林大学学报(信息科学版);2007年01期
3 张兢;候旭东;吕和胜;;基于朴素贝叶斯和支持向量机的短信智能分析系统设计[J];重庆理工大学学报(自然科学版);2010年01期
4 吕佳;;基于改进分类模型的文本分类系统实现[J];重庆师范大学学报(自然科学版);2009年02期
5 孙铁利;赵隽;杨凤芹;吴迪;;一种基于相对特征的文本分类算法[J];东北师大学报(自然科学版);2010年01期
6 陈子昕;;基于SVM的文本分类系统设计与实现[J];东莞理工学院学报;2008年03期
7 沈超;黄卫东;;数据挖掘在垃圾短信过滤中的应用[J];电子科技大学学报;2009年S1期
8 张晶;;关于过滤垃圾短信方法的研究[J];电脑知识与技术;2008年23期
9 赵小华;马建芬;;文本分类算法中词语权重计算方法的改进[J];电脑知识与技术;2009年36期
10 苏力华;朱章华;白文华;;基于向量空间模型的文本分类特征权重算法研究[J];电脑知识与技术;2010年33期
中国重要会议论文全文数据库 前3条
1 陈浩;何婷婷;代玲;;基于向量空间模型的无导词义消歧[A];第二届全国学生计算语言学研讨会论文集[C];2004年
2 任函;何婷婷;;大规模在线文本的自动分类研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
3 张爱华;靖红芳;王斌;徐燕;;文本分类中特征权重因子的作用研究[A];第五届全国信息检索学术会议论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 徐悦竹;机会发现算法及其应用研究[D];哈尔滨工程大学;2010年
2 李全彬;非约束环境下人脸识别关键技术的研究与应用[D];华东师范大学;2011年
3 常甜甜;支持向量机学习算法若干问题的研究[D];西安电子科技大学;2010年
4 彭柳青;高维高噪声数据聚类中关键问题研究[D];西安电子科技大学;2011年
5 蔡从中;支持向量机及其在生物材料功能研究中的应用[D];重庆大学;2003年
6 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
7 杨震;个性化信息获取方法的研究[D];大连理工大学;2004年
8 张道强;基于核的联想记忆及聚类算法的研究与应用[D];南京航空航天大学;2005年
9 赵晖;支持向量机分类方法及其在文本分类中的应用研究[D];大连理工大学;2006年
10 刘云峰;基于潜在语义分析的中文概念检索研究[D];华中科技大学;2005年
中国硕士学位论文全文数据库 前10条
1 岳海鸥;基于Ajax和Soap Service的应用框架及实现方法研究[D];山东科技大学;2010年
2 何昌钦;图像检索方法研究[D];大连理工大学;2010年
3 钟鸿鹏;基于时态信息的网页排序系统的研究与实现[D];华南理工大学;2010年
4 张元虹;基于主题划分的中文单文档自动文摘系统的研究[D];昆明理工大学;2009年
5 吴惠雄;基于支持向量机与聚类算法的中文文本分类研究[D];中南林业科技大学;2009年
6 王海波;垃圾短信的屏蔽机制与应用研究[D];东华大学;2011年
7 张宁;基于语义的中文文本预处理研究[D];西安电子科技大学;2011年
8 郭凯;面向Web文本的数据清洗关键技术的研究与实现[D];西安电子科技大学;2009年
9 许世明;中文网页分类技术研究及预分类算法实现[D];西安电子科技大学;2009年
10 何文涛;基于分类文本库的文本分类系统的应用研究及实现[D];中国地质大学(北京);2011年
【相似文献】
中国期刊全文数据库 前10条
1 郝海涛;;基于向量机的文本分类中词典结构研究[J];福建电脑;2009年03期
2 吴守用;;基于SVM的哈萨克语文本分类初探[J];现代计算机(专业版);2010年04期
3 赵延平;谢丽聪;;面向电信领域的文本分类研究[J];计算机与现代化;2011年02期
4 冀胜利;李波;;基于SVM的中文文本分类算法[J];重庆工学院学报(自然科学版);2008年07期
5 张玉峰;何超;;基于潜在语义分析和HS-SVM的文本分类模型研究[J];情报理论与实践;2010年07期
6 陈立孚,周宁,李丹;基于机器学习的自动文本分类模型研究[J];现代图书情报技术;2005年10期
7 张伟;邹汉斌;雷红艳;刘琼;;一种基于正例的SVM分类方法[J];江南大学学报(自然科学版);2007年01期
8 刘怀亮;张治国;赵捧未;;中文文本分类反馈学习研究[J];情报理论与实践;2009年06期
9 刘秀松;;基于改进的SVM文本分类建模[J];情报理论与实践;2007年06期
10 贾燕花;徐蔚鸿;;K-means聚类和支持向量机结合的文本分类研究[J];计算机工程与应用;2010年22期
中国重要会议论文全文数据库 前10条
1 卢卫雄;;一种基于支持向量机的多国语言文本分类平台[A];第十六届全国青年通信学术会议论文集(上)[C];2011年
2 朱慕华;朱靖波;陈文亮;;面向支持向量机的降维方法比较分析[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
3 曹菲菲;朱慕华;朱靖波;;基于抽样的两阶段支持向量机训练算法[A];第三届学生计算语言学研讨会论文集[C];2006年
4 牛强;王志晓;陈岱;夏士雄;;基于支持向量机的Web文本分类方法[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年
5 栾江;唐常杰;黄晓冬;阴小雄;廖勇;;一种增量式支持向量机文本分类模型[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
6 陈克利;宗成庆;王霞;;基于大规模真实文本的平衡语料分析与文本分类方法[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
7 杜长海;吉根林;;模糊聚类的最大树法在文本分类中的应用研究[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
8 贾会强;刘晓丽;于洪志;;基于词性特征提取的藏文文本分类方法研究[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年
9 杨凌;刘玉树;;基于支持向量机的坦克识别算法[A];第三届全国数字成像技术及相关材料发展与应用学术研讨会论文摘要集[C];2004年
10 许建生;盛立东;;基于改进的支持向量机和BP神经网络的识别算法[A];第八届全国汉字识别学术会议论文集[C];2002年
中国重要报纸全文数据库 前4条
1 清华大学 苏光大;非接触式人脸识别技术[N];计算机世界;2006年
2 ;选择合适的数据挖掘算法[N];计算机世界;2007年
3 希安;微软试水信息检索[N];经济日报;2004年
4 王培森;从Web挖到竞争情报[N];中国计算机报;2003年
中国博士学位论文全文数据库 前10条
1 秦玉平;基于支持向量机的文本分类算法研究[D];大连理工大学;2008年
2 平源;基于支持向量机的聚类及文本分类研究[D];北京邮电大学;2012年
3 燕忠;基于蚁群优化算法的若干问题的研究[D];东南大学;2005年
4 佟伟民;股指期货交易中操纵行为识别方法研究[D];哈尔滨工业大学;2008年
5 陈万海;基于支持向量机的超谱图像分类技术研究[D];哈尔滨工程大学;2008年
6 田江;基于支持向量机的孤立点检测方法研究[D];大连理工大学;2009年
7 何静媛;RNA二级结构预测算法的研究[D];重庆大学;2009年
8 李伦波;自然场景下交通标志的检测与分类算法研究[D];哈尔滨工业大学;2008年
9 陈宝文;蚁群优化算法在车辆路径问题中的应用研究[D];哈尔滨工业大学;2009年
10 章舜仲;文本分类中词共现关系的研究及其应用[D];南京理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 张滨;中文文档分类技术研究[D];武汉大学;2004年
2 崔彩霞;基于支持向量机的文本分类方法研究[D];山西大学;2005年
3 牛肖潇;支持向量机及用于文本分类的研究[D];武汉理工大学;2006年
4 李强;基于支持向量机的文本分类方法研究[D];西安科技大学;2009年
5 于海龙;面向PU问题的文本分类的研究与实现[D];吉林大学;2005年
6 马忠宝;基于支持向量机的中文文本分类系统研究[D];武汉理工大学;2006年
7 邹丹;基于Web的中文文本分类的研究与实现[D];中国地质大学(北京);2006年
8 代亮;基于支持向量机的文本分类问题研究[D];大连海事大学;2007年
9 阿雅娜;蒙古文停用词表和词干提取对蒙古文文本分类的影响[D];内蒙古大学;2009年
10 邸锦;基于支持向量机的文本分类问题的研究[D];北京交通大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026