收藏本站
《内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

基于双字耦合度的中文分词交叉歧义处理方法

王思力  王斌  
【摘要】:本文提出了一种利用双字耦合度和 t-测试差解决中文分词中交叉歧义的方法:首先利用词典找出所有的交叉歧义,然后用双字耦合度和 t-测试差的线性叠加值来判断各歧义位置是否该切分。实验结果表明,双字耦合度和 t-测试差的结合要优于互信息和 t-测试差的结合,因此,用双字耦合度和 t-测试差的线性叠加值来消除交叉歧义是一种简单有效的方法。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 陈丽江;从ACL-SIGHAN国际分词竞赛看已知词和未登录词识别的平衡问题[J];南京师范大学文学院学报;2005年01期
2 何正国;;AntConc在机器翻译的译前处理中的应用[J];经济研究导刊;2011年15期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
11 ;[J];;年期
12 ;[J];;年期
13 ;[J];;年期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前7条
1 王思力;王斌;;基于双字耦合度的中文分词交叉歧义处理方法[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
2 赵海;揭春雨;;基于子串标注的中文分词:寻找更佳的标注单元[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
3 曾华琳;史晓东;李堂秋;;基于上下文信息提取的概率分词算法[A];第六届汉语词汇语义学研讨会论文集[C];2005年
4 王芳;万常选;;基于可信度的中文完整词自动识别[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
5 曹海龙;内山■夫;隅田英一郎;;一种面向统计机器翻译的中文分词自适应方法(英文)[A];机器翻译研究进展——第四届全国机器翻译研讨会论文集[C];2008年
6 陈丽江;;ACL-SIGHAN第一届国际中文分词竞赛评述[A];第二届全国学生计算语言学研讨会论文集[C];2004年
7 郭稷;吕雅娟;刘群;;一种有效的基于Web的双语翻译对获取方法[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978