收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

一种自适应概率语言模型的训练方法及其应用于中文分词

徐志明  揭春雨  Jonathan ebster  
【摘要】:本文提出一种自适应的概率语言模型的训练方法,采用EH迭代优化算法在未切分的语料库上训练概率语言模型的参数。本文用该算法训练了中文的基于词的N-gram模型,并应用于概率分词。实验结果显示,该算法能显著地改善汉语分词的精度。

知网文化
【相似文献】
中国重要会议论文全文数据库 前4条
1 徐志明;揭春雨;Jonathan ebster;;一种自适应概率语言模型的训练方法及其应用于中文分词[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 李航;;用于词汇知识获取和结构消歧的一种统计学习方法(英文)[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
3 徐志明;王晓龙;张凯;关毅;孙玉琦;;语音识别语言理解模型[A];第五届全国人机语音通讯学术会议论文集[C];1998年
4 李刚;童頫;谷晓锋;;有向图模型的模型解释[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
中国硕士学位论文全文数据库 前1条
1 袁浩;连续语音中关键词快速检出的研究[D];哈尔滨工业大学;2011年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978