收藏本站
《辉煌二十年——中国中文信息学会二十周年学术会议论文集》2001年
收藏 | 手机打开
二维码
手机客户端打开本文

基于boosting的文本分类在股市领域信息抽取系统中的应用

房一飞  张冬茉  
【摘要】:首先介绍了特定领域多语种信息抽取系统的基本模型,并针对该系统的预处理模块的需要,提出了一种基于机器学习方法的文本分类系统.该系统通过boosting算法,对一个易实现的弱分类器进行增强,最后获得一个强分类器,从而避免了直接构造强分类器的困难.实验证明;相对于直接构造强分类器,该算法具有简单灵活,易于实现的优点,其构造出来的分类器达到了信息抽取系统的要求.
【作者单位】:上海交通大学 上海交通大学
【基金】:国自然科学基金(项目:60083003)资助
【分类号】:TP399

手机知网App
【共引文献】
中国期刊全文数据库 前9条
1 张郴;张捷;;中国入境旅游需求预测的神经网络集成模型研究[J];地理科学;2011年10期
2 孙赜,白志强,樊光明,施彬;决策树方法在遥感地质填图中的应用[J];地球科学;2004年06期
3 马瑞民;邹会文;王浩畅;;一种简单的流式数据动态分类算法[J];大庆石油学院学报;2009年02期
4 李文斌;刘椿年;陈嶷瑛;;基于混合高斯模型的电子邮件多过滤器融合方法[J];电子学报;2006年02期
5 王一萍;粗糙集理论在入侵检测中的应用研究[J];齐齐哈尔大学学报;2005年01期
6 朱敏;张永清;李梦龙;周大威;黄俊;;基于集成学习方法的蛋白质相互作用预测[J];四川大学学报(工程科学版);2011年03期
7 李国正;李丹;;集成学习中特征选择技术[J];上海大学学报(自然科学版);2007年05期
8 吴建生;;最小一乘回归神经网络集成方法股市建模研究[J];计算机工程与设计;2007年23期
9 王磊;杨超;卢宝荣;;利用决策树方法建立转基因植物环境生物安全评价诊断平台[J];生物多样性;2010年03期
中国重要会议论文全文数据库 前2条
1 ;Nave Bayes Ensemble Learning Based on Oracle Selection[A];2009中国控制与决策会议论文集(1)[C];2009年
2 吴月明;王益群;李莉;;基于神经网络集成的可靠性分布模型的智能识别[A];2006年全国机械可靠性学术交流会论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 甘良志;核学习算法与集成方法研究[D];浙江大学;2010年
2 齐峰;人工神经树网络模型的优化研究与应用[D];山东师范大学;2011年
3 张翔;文本挖掘技术研究及其在综合风险信息网络中的应用[D];西北大学;2011年
4 王中锋;树型贝叶斯网络分类器鉴别式训练研究[D];北京交通大学;2011年
5 刘冲;模拟电路故障诊断AdaBoost集成学习方法研究[D];大连海事大学;2011年
6 罗建宏;粒计算分类知识发现算法及其应用[D];浙江大学;2010年
7 赵楠;基于机器学习的供应链绩效智能分析方法研究[D];天津大学;2010年
8 张春霞;集成学习中有关算法的研究[D];西安交通大学;2010年
9 张沐光;基于局部—全局结构分析的统计过程监测方法研究[D];浙江大学;2011年
10 陈元;基于分类模型的知识发现过程研究[D];国防科学技术大学;2002年
中国硕士学位论文全文数据库 前10条
1 陈松峰;利用PCA和AdaBoost建立基于贝叶斯的组合分类器[D];郑州大学;2010年
2 徐瑜;基于主动差异学习神经网络集成的电力变压器故障诊断方法研究[D];湘潭大学;2010年
3 张新东;集成学习及其应用研究[D];石家庄经济学院;2010年
4 高艳;基于软间隔的AdaBoost弱分类器权重调整算法[D];西安电子科技大学;2011年
5 李福才;流行学习在交通标志识别中的应用研究[D];西安电子科技大学;2010年
6 华喜彬;动物习性研究中数字标识符识别的研究[D];西北大学;2011年
7 刘莹;基于SVM维吾尔文印刷体识别分类器设计[D];新疆大学;2011年
8 康恒政;多分类器集成技术研究[D];西南交通大学;2011年
9 钟懿丽;基于PKI的网络安全技术平台的设计与实现[D];电子科技大学;2011年
10 付焕焕;基于集成学习的入侵检测系统的研究与实现[D];南京航空航天大学;2010年
【相似文献】
中国期刊全文数据库 前10条
1 朱学昊;王儒敬;;隐含语义索引技术在供求信息分类中的应用[J];计算机工程与应用;2007年14期
2 程志;黄荣怀;;文本挖掘及其教育应用[J];现代远距离教育;2008年02期
3 魏顺平;何克抗;;文本智能处理技术在远程教育元研究中的应用[J];中国远程教育;2007年08期
4 于琨;管刚;周明;王煦法;蔡庆生;;基于双层级联文本分类的简历信息抽取[J];中文信息学报;2006年01期
5 巩知乐;张德贤;;文本挖掘理论概述[J];福建电脑;2008年09期
6 高金勇;徐朝军;冯奕竸;;基于迭代的TFIDF在短文本分类中的应用[J];情报理论与实践;2011年06期
7 张宏松;刘建辉;;面向Web的文本信息挖掘研究[J];计算机系统应用;2006年09期
8 郑海,林鸿飞;基于段落匹配的文本分类机制[J];计算机工程与应用;2004年28期
9 王丁,运海红,张辉;文本自动分类系统的研究与实现[J];信息技术;2005年03期
10 杜志文;曾文华;;网格计算在文本分类中的应用[J];微电子学与计算机;2006年S1期
中国重要会议论文全文数据库 前10条
1 房一飞;张冬茉;;基于boosting的文本分类在股市领域信息抽取系统中的应用[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
2 陈克利;宗成庆;王霞;;基于大规模真实文本的平衡语料分析与文本分类方法[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
3 杜长海;吉根林;;模糊聚类的最大树法在文本分类中的应用研究[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
4 海丽且木·艾沙;维尼拉·木沙江;;Web文本分类及其维、哈、柯多文种信息检索中的应用研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
5 胡俊;黄厚宽;;一种基于SVM的可视化文本分类的方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
6 朱慕华;陈文亮;朱靖波;;词聚类在文本分类中的应用[A];第二届全国学生计算语言学研讨会论文集[C];2004年
7 贾会强;刘晓丽;于洪志;;基于词性特征提取的藏文文本分类方法研究[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年
8 肖婷;唐雁;;文本分类中特征选择方法及应用[A];2008年计算机应用技术交流会论文集[C];2008年
9 赵修湘;石勇;刘莹;张玲玲;;文本分类在软件缺陷管理中的应用[A];第四届(2009)中国管理学年会——管理科学与工程分会场论文集[C];2009年
10 徐志明;丛帅;王宇颖;雷萌;;基于仿生模式识别文本分类算法[A];第五届全国信息检索学术会议论文集[C];2009年
中国重要报纸全文数据库 前3条
1 希安;微软试水信息检索[N];经济日报;2004年
2 上海交通大学APEX数据和知识管理实验室 王昊奋俞勇;语义Web推动下一代搜索[N];计算机世界;2007年
3 王培森;从Web挖到竞争情报[N];中国计算机报;2003年
中国博士学位论文全文数据库 前10条
1 章舜仲;文本分类中词共现关系的研究及其应用[D];南京理工大学;2010年
2 孟佳娜;迁移学习在文本分类中的应用研究[D];大连理工大学;2011年
3 李智星;用于文本分类的简明语义分析技术研究[D];重庆大学;2011年
4 刘伍颖;面向垃圾信息过滤的主动多域学习文本分类方法研究[D];国防科学技术大学;2011年
5 王博;文本分类中特征选择技术的研究[D];国防科学技术大学;2009年
6 郭勇;基于语义的网络知识获取相关技术研究[D];国防科学技术大学;2007年
7 祝翠玲;基于类别结构的文本层次分类方法研究[D];山东大学;2011年
8 冯国忠;文本分类中的贝叶斯特征选择[D];东北师范大学;2011年
9 刘亚清;开放式环境中的本体演化及其在信息抽取的应用研究[D];大连海事大学;2011年
10 宋枫溪;自动文本分类若干基本问题研究[D];南京理工大学;2004年
中国硕士学位论文全文数据库 前10条
1 周志平;Boosting在文本分类中的应用[D];东北师范大学;2010年
2 曲杰涛;基于DOM的智能网页信息抽取技术研究[D];中国海洋大学;2009年
3 张彪;文本分类中特征选择算法的分析与研究[D];中国科学技术大学;2010年
4 郭峰;面向行业搜索引擎的WEB文本挖掘技术研究[D];兰州大学;2006年
5 张保富;基于粗糙集的中文文本分类算法研究及应用[D];江苏大学;2010年
6 蒋健;文本分类中特征提取和特征加权方法研究[D];重庆大学;2010年
7 闫晨;KNN文本分类研究[D];燕山大学;2010年
8 苏小康;基于维基百科构建语义知识库及其在文本分类领域的应用研究[D];华中师范大学;2010年
9 李璇;基于坐标下降法的半监督学习算法及其在文本分类中的应用[D];华南理工大学;2010年
10 宋志理;基于LDA模型的文本分类研究[D];西安理工大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026