收藏本站
《第二届全国学生计算语言学研讨会论文集》2004年
收藏 | 手机打开
二维码
手机客户端打开本文

Co-training机器学习方法在中文组块识别中的应用

刘世岳  李珩  张俐  姚天顺  
【摘要】:采用半指导机器学习方法Co-training实现中文组块识别。首先明确了中文组块的定义,Co-training算法的形式化定义。文中提出了基于一致性的Co-training选取方法将增益的隐马尔可夫模型(Transductive HMM)和基于转换规则的分类器(fnTb1)组合成一个分类体系,并与自我训练方法进行了比较,在小规模汉语树库语料和大规模未带标汉语语料上进行中文组块识别,实验结果要比单纯使用小规模的树库语料有所提高,F值分别达到了85.34%和83.41%,分别提高了2.13%和7.21%。

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 张君昌;张译;;基于改进AdaBoost算法的人脸检测[J];计算机仿真;2011年07期
2 田晶华;李翠平;陈红;;基于类标签聚类的动态问题分类集成学习算法[J];计算机科学与探索;2011年09期
3 张雪松;;基于级联AdaBoost的Snort异常检测预处理插件研究[J];科学技术与工程;2011年17期
4 王刚;黄星元;施明智;胡挺;张旭炜;李焰;;光纤围栏扰动事件模式识别研究[J];光通信技术;2011年07期
5 林川;潘盛辉;谭光兴;李梦和;;基于聚类与链码技术的交通标志检测[J];计算机测量与控制;2011年06期
6 李军辉;周国栋;朱巧明;钱培德;;中文名词性谓词语义角色标注[J];软件学报;2011年08期
7 谭衢霖;徐东彪;;基于面向对象分类的密云县城区地面不透水程度分析[J];北京交通大学学报;2011年04期
8 蔡华利;刘鲁;王理;;突发事件Web新闻多层次自动分类方法[J];北京工业大学学报;2011年06期
9 霍红文;封举富;;基于多类在线Boosting的图像识别算法[J];计算机辅助设计与图形学学报;2011年07期
10 王燕;公维军;;双阈值级联分类器的加速人脸检测算法[J];计算机应用;2011年07期
中国重要会议论文全文数据库 前10条
1 刘世岳;李珩;张俐;姚天顺;;Co-training机器学习方法在中文组块识别中的应用[A];第二届全国学生计算语言学研讨会论文集[C];2004年
2 穆明生;;基于特征集的多种分类器模型的在线笔迹认证[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
3 朱思俞;石锋;;不定人连续汉语音的四声识别[A];第二届全国人机语音通讯学术会议论文集[C];1992年
4 邵小健;段华;贺国平;;一种改进的最少核分类器[A];中国运筹学会第七届学术交流会论文集(上卷)[C];2004年
5 徐蔚然;于武贵;郭军;;基于统计方法的混排文字切分与分类[A];第八届全国汉字识别学术会议论文集[C];2002年
6 雷蕾;吴乃君;刘鹏;刘兰娟;;灵敏度分析:分类器中的缺失数据[A];第11届海峡两岸信息管理发展策略研讨会论文集[C];2005年
7 陈颖颖;张雁军;贾鑫;;通信信号调制识别方法[A];第一届中国高校通信类院系学术研讨会论文集[C];2007年
8 李刚;郭崇慧;林鸿飞;杨志豪;唐焕文;;基于词典法和机器学习法相结合的蛋白质名识别[A];大连理工大学生物医学工程学术论文集(第2卷)[C];2005年
9 肖惠玲;曾翎;黄海莹;张琳;王昱清;杨勤;陈华富;;支持向量机探测脑功能活动[A];中国生物医学工程进展——2007中国生物医学工程联合学术年会论文集(下册)[C];2007年
10 沈钱波;何加铭;;连笔手写识别搜索算法研究[A];浙江省电子学会2008年学术年会论文集[C];2008年
中国重要报纸全文数据库 前10条
1 黄明;精子分类器决定生男生女[N];广东科技报;2000年
2 ;蓝疆号完成海上吊装[N];中国证券报;2003年
3 记者 齐芳;“顿悟”是怎么发生的[N];光明日报;2011年
4 记者 梁利华;北京应用透水树脂组块进行树池铺装[N];中国环境报;2004年
5 记者 姜晓凌 见习记者 王毅俊;原来,科技也能如此美丽[N];上海科技报;2007年
6 中国科学院东北地理与农业生态研究所 李建平;保护地球之肾 遥感体检湿地健康[N];中国水利报;2008年
7 CPW 张戈;Aperto PacketMAX系列可同时服务2000个用户[N];电脑商报;2005年
8 本报记者 殷元元;城在青山绿水间 人在鸟语花香中[N];黄山日报;2007年
9 本报记者  陈袆淼;亚洲最大海洋石油工程制造场地一期竣工投产[N];中国工业报;2006年
10 记者 朱磊;亚洲最大海洋石油工程制造场地投产[N];经济日报;2006年
中国博士学位论文全文数据库 前10条
1 王喆;面向模式表示与模式源的分类器设计方法研究[D];南京航空航天大学;2008年
2 谢元澄;分类器集成研究[D];南京理工大学;2009年
3 严志永;在划分数据空间的视角下基于决策边界的分类器研究[D];浙江大学;2011年
4 杨显飞;数据流集成分类器算法研究[D];哈尔滨工程大学;2011年
5 冯爱民;结构驱动的单类分类器设计及拓展研究[D];南京航空航天大学;2011年
6 宁博;面向行人检测的动态视觉词提取与集成分类方法研究[D];中国科学技术大学;2012年
7 汪中;面向变化场景的行人分类检测方法研究[D];中国科学技术大学;2011年
8 薛晖;分类器设计中的正则化技术研究[D];南京航空航天大学;2008年
9 王彦;基于PDE的模式识别方法[D];吉林大学;2006年
10 欧阳震诤;不平稳数据流的分类技术研究[D];国防科学技术大学;2009年
中国硕士学位论文全文数据库 前10条
1 魏媛;一种应用于文本信息隐藏的组块分析算法的设计与实现[D];西北大学;2012年
2 袁超越;情感组块与机器学习相结合的文本倾向性分析[D];哈尔滨工程大学;2011年
3 武婷婷;分类器性能评价研究[D];北京交通大学;2010年
4 王亚松;关于组合分类器修剪方法的研究[D];郑州大学;2011年
5 宋宏珂;工作记忆个体差异和记忆负荷对组块加工的影响[D];西南大学;2010年
6 石国强;基于规则的组合分类器的研究[D];郑州大学;2010年
7 于柏森;发动机机械故障诊断系统分类器设计[D];长春工业大学;2010年
8 潘世瑞;基于分类器集成技术的数据流分类研究[D];西北农林科技大学;2011年
9 王秀霞;分类器的选择性集成及其差异性研究[D];兰州理工大学;2011年
10 宋丽;基于决策树的组合分类器的研究[D];西安电子科技大学;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026