收藏本站
《第四届全国学生计算语言学研讨会会议论文集》2008年
收藏 | 手机打开
二维码
手机客户端打开本文

基于基本块的汉语功能块自动标注

李国臣  王瑞波  李济洪  
【摘要】:本文研究了基于基本块信息使用条件随机场模型(CRF)对汉语功能块进行自动标注的问题。针对词和基本块的两种不同的标注策略,将汉语基本块信息分别形式化成相应的特征,通过大量的特征组合优化实验,进行特征选择和模型参数估计。实验结果表明,在CRF模型中,基本块相关特征信息的加入可以大幅度地提高功能块识别性能。开放测试表明,在以基本块为单位的标注策略下,功能块自动标注的F值达到89.12%,这是目前最好的汉语功能块自动标注结果。
【作者单位】:山西大学计算机与信息技术学院 山西大学计算中心
【分类号】:H146

手机知网App
【共引文献】
中国期刊全文数据库 前3条
1 徐延勇,郭忠伟,周献中;基于最大熵方法的统计语言模型[J];计算机工程与应用;2002年05期
2 胡俊峰 ,俞士汶;唐宋诗中词汇语义相似度的统计分析及应用[J];中文信息学报;2002年04期
3 巴.萨日娜;《蒙古语语法信息词典》动词语法属性字段设置[J];内蒙古大学学报(人文.社会科学版);2005年06期
中国重要会议论文全文数据库 前2条
1 唐兴全;;现代汉语复杂句蜕块研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 周强;赵颖泽;;汉语功能块自动分析[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
中国博士学位论文全文数据库 前5条
1 达胡白乙拉;蒙古语基本动词短语自动识别研究[D];内蒙古大学;2005年
2 曹海龙;基于词汇化统计模型的汉语句法分析研究[D];哈尔滨工业大学;2006年
3 徐艳华;现代汉语实词语法功能考察及词类体系重构[D];南京师范大学;2006年
4 杨震;文本分类和聚类中若干问题的研究[D];北京邮电大学;2007年
5 刘大健;模糊模式识别在模拟驾驶系统中的应用研究[D];浙江大学;2005年
中国硕士学位论文全文数据库 前6条
1 唐兴全;现代汉语复杂句蜕块研究[D];北京语言文化大学;2002年
2 李盛;面向真实文本的汉语词义排歧系统[D];山西大学;2003年
3 李海霞;基于自然语言的图像数据库检索技术研究[D];山东师范大学;2004年
4 王源媛;中文未登录名词短语的识别方法研究[D];重庆大学;2004年
5 王广正;基于知网语义相关度计算的汉语自动分词方法的研究[D];云南师范大学;2006年
6 邢富坤;基于信息计算的英语易读性研究及IRMS应用系统开发[D];中国人民解放军外国语学院;2007年
【二级参考文献】
中国期刊全文数据库 前1条
1 周强;汉语句法树库标注体系[J];中文信息学报;2004年04期
【相似文献】
中国重要会议论文全文数据库 前2条
1 李国臣;王瑞波;李济洪;;基于基本块的汉语功能块自动标注[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
2 周强;赵颖泽;;汉语功能块自动分析[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026