一种自适应概率语言模型的训练方法及其应用于中文分词
【摘要】:本文提出一种自适应的概率语言模型的训练方法,采用EH迭代优化算法在未切分的语料库上训练概率语言模型的参数。本文用该算法训练了中文的基于词的N-gram模型,并应用于概率分词。实验结果显示,该算法能显著地改善汉语分词的精度。
【相似文献】 | ||
|
|||||||||
|
|
|||
|
【相似文献】 | ||
|
|||||||||
|
|
|||
|