基于语料统计的以“不”开头双字分词不一致研究
【摘要】:大规模语料库中分词不一致现象普遍存在,并影响语料库的建设质量。在对熟语料进行分析统计的基础上,着重研究以“不”开头的双字结构,深入分析该结构分词不一致的产生原因。从全新的角度以集合的概念进行详细分类,并得出造成组合型歧义和分词变异的一系列原因。
【作者单位】:南京师范大学文学院 南京师范大学文学院 南京师范大学文学院
【关键词】:分词不一致 “不”开头的双字 组合型歧义 分词变异
【分类号】:TP391.1
【正文快照】:
【关键词】:分词不一致 “不”开头的双字 组合型歧义 分词变异
【分类号】:TP391.1
【正文快照】:
引言 分词是汉语自动分析中必不可少的第一道工序,分词不一致问题是自动分词中面临的一大难题,直接关系到 语料库的建设。1988年国家审定颁布的《信息处理用现代汉语分词规范(国家标准)))(以下简称《规范)))从信 息处理的实际要求出发,根据现代汉语的特点和规律,确定了一
CAJViewer7.0阅读器支持所有CNKI文件格式,AdobeReader仅支持PDF格式
| 【参考文献】 | ||
|
|||||||||
|
|||||||||
| 【共引文献】 | ||
|
|||||||||||||||||||||
|
|||||||||||||||||||||
|
|||||||||||||||||||||
|
|||||||||||||||||||||
|
|||||||||||||||||||||
|
|||||||||||||||||||||
|
|||||||||||||||||||||
|
|||||||||||||||||||||
| 【二级参考文献】 | ||
|
|||||||||||
|
|||||||||||
|
|||
|
|||



