收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

利用未标注语料改进实体名识别性能

陈宁昱  周雅倩  黄萱菁  吴立德  
【摘要】:本文主要介绍了一个利用最大熵进行实体名识别的系统以及所采用的模型和选取的特征。利用这些在任何语言的文本上都极易获得的特征,我们构建了一个基准系统。在此基础上,我们在未标注语料上抽取出现的实体名作为辅助的训练语料,再将这些语料加入训练。实验结果表明,辅助的训练语料能够在一定程度上提高系统的性能。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 吕红,李时光,徐问之,闫旭,吕怡;不完全扇形投影数据的图象重建算法研究[J];重庆大学学报(自然科学版);1997年05期
2 张一哲;曲维光;刘金克;孙玉霞;;基于分类器集成的兼类词消歧研究[J];南京师大学报(自然科学版);2010年04期
3 吴谨,李娟,刘成云,夏贝贝;基于最大熵的灰度阈值选取方法[J];武汉科技大学学报(自然科学版);2004年01期
4 余卫雄,姜礼平;基于粗集和最大熵的模式识别方法[J];海军工程大学学报;2004年03期
5 曹力;史忠科;郑家伟;;基于最大熵的自动确定多阈值方法(英文)[J];Transactions of Nanjing University of Aeronautics & Astronau;2005年04期
6 覃颖;石勇涛;;基于最大熵的虹膜定位算法[J];三峡大学学报(自然科学版);2006年04期
7 王青,陈韶华;基于神经网络优化的少数投影最大熵层析图像重建算法[J];量子电子学报;2003年01期
8 杨姝;孙玉敏;齐振国;高立群;;WKS熵阈值法的快速算法[J];沈阳工业大学学报;2006年02期
9 汪筱红;须文波;;遗传算法在最大熵多阈值分割的应用研究[J];贵州大学学报(自然科学版);2007年04期
10 叶志伟;常胜;高山;;基于蚁群算法的最佳熵图像分割阈值方法[J];湖北民族学院学报(自然科学版);2007年03期
11 汪筱红;须文波;;遗传算法在最大熵多阈值分割的应用研究[J];湖南工程学院学报(自然科学版);2007年04期
12 郭娟;杨为民;石亚和;;基于微粒群算法的二维最大熵图像分割方法[J];计算机仿真;2005年11期
13 杨必武;倪志斌;;图像配准中基于最大熵的模板选取算法研究[J];红外与激光工程;2006年S4期
14 房华;程国建;吴文海;;一种基于最大熵的改进型PCNN图像分割新方法[J];软件导刊;2010年05期
15 毕晓君;李云刚;;基于自由搜索算法的图像分割研究[J];信息技术;2010年07期
16 张雪锋;范九伦;;一种改进的混沌序列产生方法[J];数学的实践与认识;2009年18期
17 王亮亮;王黎;高晓蓉;王泽勇;;基于视频图像的运动目标检测算法研究[J];微计算机信息;2010年16期
18 曹力,史忠科;基于最大熵原理的多阈值自动选取新方法[J];中国图象图形学报;2002年05期
19 林开颜,吴军辉,徐立鸿;基于模糊规则的彩色图像边缘检测方法[J];微型电脑应用;2004年09期
20 杨靛青;刘秉瀚;郑智勇;;基于CMYK模式下淋巴瘤病理彩色图像分割[J];福建电脑;2007年12期
中国重要会议论文全文数据库 前10条
1 陈宁昱;周雅倩;黄萱菁;吴立德;;利用未标注语料改进实体名识别性能[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
2 孙萌;姚建民;吕雅娟;刘群;姜文斌;;基于最大熵短语重排序模型的特征抽取算法改进[A];第五届全国青年计算语言学研讨会论文集[C];2010年
3 赵妍妍;王啸吟;秦兵;车万翔;刘挺;;中文事件抽取中事件类别的自动识别[A];第三届学生计算语言学研讨会论文集[C];2006年
4 付瑞吉;车万翔;刘挺;;一种基于分类方法的音乐命名实体识别技术[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年
5 王毅;赵海涛;郝重阳;;最大熵三维图像分割算法研究[A];全国第十届信号与信息处理、第四届DSP应用技术联合学术会议论文集[C];2006年
6 方高林;于浩;;最大熵语言模型及其在模式识别中新的应用[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
7 杨必武;倪志斌;;图像配准中基于最大熵的模板选取算法研究[A];2006年全国光电技术学术交流会会议文集(D 光电信息处理技术专题)[C];2006年
8 刘茂福;金可佳;姬东鸿;张晓龙;;统计与规则相结合的指代消解在事件自动文摘中的应用[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
9 丁伟伟;常宝宝;;基于最大熵原则的汉语语义角色分类[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
10 姚树杰;肖桐;朱靖波;;基于句对质量和覆盖度的统计机器翻译训练语料选取[A];第五届全国青年计算语言学研讨会论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 张素香;信息抽取中关键技术的研究[D];北京邮电大学;2007年
2 肖镜辉;非时齐语言建模技术研究及实践[D];哈尔滨工业大学;2007年
3 王智强;汉语指代消解及相关技术研究[D];北京邮电大学;2006年
4 陈博;WEB文本情感分类中关键问题的研究[D];北京邮电大学;2008年
5 姜维;统计中文词法分析及其强化学习机制的研究[D];哈尔滨工业大学;2007年
6 张红民;厚组织荧光显微图像复原方法研究[D];华中科技大学;2007年
7 洪宇;基于语义结构和时序特征的话题检测与跟踪技术研究[D];哈尔滨工业大学;2009年
8 高红;基于统计语言模型的汉语浅层分析研究[D];大连理工大学;2007年
9 刘鹏远;基于知识自动获取的无指导译文消歧方法研究[D];哈尔滨工业大学;2008年
10 胡明涵;面向领域的文本分类与挖掘关键技术研究[D];东北大学 ;2009年
中国硕士学位论文全文数据库 前10条
1 张磊;基于最大熵模型的汉语词性标注研究[D];大连理工大学;2008年
2 孔海霞;基于最大熵的汉语词性标注[D];大连理工大学;2007年
3 王莹;基于错误驱动的汉语词性标注研究[D];北京邮电大学;2007年
4 何楠;基于统计机器学习的两阶段中文命名实体识别研究[D];北京邮电大学;2008年
5 潘炜;面向层次分类标签的词性标注系统[D];复旦大学;2009年
6 张步峰;基于短语统计机器翻译系统的研究[D];天津大学;2007年
7 任登君;面向机器学习方法的命名实体识别[D];东北大学;2005年
8 赵巍;差分图像中运动变化区域检测技术研究[D];新疆大学;2006年
9 陈明;指纹识别算法研究与实现[D];电子科技大学;2005年
10 赵瑶池;基于图像处理的熔体界面性质分析系统的研究与实现[D];中南大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978