收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于条件随机场的中文命名实体识别特征比较研究

张祝玉  任飞亮  朱靖波  
【摘要】:命名实体识别任务主要是识别文本中的人名、地名、机构名等实体。基于条件随机场的命名实体识别是目前常用方法。特征是影响命名实体识别性能的重要因素,由于命名实体识别任务中可用到的特征及其组合很多,因此选取合适的特征是提高性能、节省模型训练时间的重要途径。基于字和基于词的命名实体识别是两种基本框架,本文在这两种框架下比较了特征及其组合对命名实体识别性能的影响。在Sighan-6评测语料上的实验结果表明,命名实体列表、词性、词边界、前后缀特征对识别性能提升较大,组合特征可以提高系统的性能。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 年洪东;;利用现有资源快速实现汉语专用分词系统[J];文教资料;2007年29期
2 王宝勋;王晓龙;刘秉权;李鹏;;一种基于无监督学习的词变体识别方法[J];中文信息学报;2008年03期
3 肖航;第41届国际计算语言联合会在日本召开[J];语言文字应用;2003年03期
4 李艳翠;杨勇;周国栋;朱巧明;;基于支持向量机的英语名词短语指代消解[J];计算机工程;2009年03期
5 张楠;丁华福;;基于共现词语的特征选取在文本分类中的研究[J];科技资讯;2006年35期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
11 ;[J];;年期
12 ;[J];;年期
13 ;[J];;年期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前7条
1 张祝玉;任飞亮;朱靖波;;基于条件随机场的中文命名实体识别特征比较研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
2 向晓雯;史晓东;曾华琳;;一个统计与规则相结合的中文命名实体识别系统[A];第六届汉语词汇语义学研讨会论文集[C];2005年
3 廖先桃;于海滨;秦兵;刘挺;;HMM与自动规则提取相结合的中文命名实体识别[A];第二届全国学生计算语言学研讨会论文集[C];2004年
4 邹纲;刘洋;刘群;孟遥;于浩;西野文人;亢世勇;;面向Internet的中文新词语检测[A];2004年辞书与数字化研讨会论文集[C];2004年
5 郭稷;吕雅娟;刘群;;一种有效的基于Web的双语翻译对获取方法[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
6 宁伟;苗雪雷;胡永华;季铎;张桂平;蔡东风;;基于SVM的无参考译文的译文质量评测[A];机器翻译研究进展——第四届全国机器翻译研讨会论文集[C];2008年
7 王会珍;朱靖波;陈文亮;季铎;张斌;;基于一元语法模型的中文话题追踪[A];第二届全国学生计算语言学研讨会论文集[C];2004年
中国博士学位论文全文数据库 前1条
1 陈慧;基于DCC动态流通语料库的中文组织名考察与研究[D];北京语言大学;2008年
中国硕士学位论文全文数据库 前6条
1 武玉洲;汉语文本人名识别改进方法研究[D];北京语言大学;2007年
2 祝慧佳;汉语名词复合短语识别与分类的方法研究[D];哈尔滨工业大学;2007年
3 洪鹿平;汉语复句关系自动判定研究[D];南京师范大学;2008年
4 程月;现代汉语动宾搭配多角度考察及其自动识别[D];南京师范大学;2008年
5 刘立;统计中文问句分类研究[D];昆明理工大学;2012年
6 叶西切忠;基于web的藏文文本自动分类研究与实现[D];青海民族大学;2012年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978