收藏本站
《中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集》2006年
收藏 | 手机打开
二维码
手机客户端打开本文

藏文短语及其嵌套短语的提取

毋建军  张俊林  孙乐  吴健  次仁罗布  陈俊杰  
【摘要】:本文提出一种自动提取藏文短语及其嵌套短语搭配的算法,它通过采用基于统计长短语内词语之间的触发共现和基于句法特征规则相结合的处理策略,利用数据挖掘中的Apriori算法和FTP Tree数据存储结构,克服了N-gram统计语言模型在藏文短语搭配提取中没有考虑语言本身结构特性的缺陷,实验结果表明,短语提取的准确率和召回率都有很大的提高。

手机知网App
【参考文献】
中国期刊全文数据库 前3条
1 陈玉忠,李保利,俞士汶;藏文自动分词系统的设计与实现[J];中文信息学报;2003年03期
2 江荻;现代藏语组块分词的方法与过程[J];民族语文;2003年04期
3 陈玉忠,李保利,俞士汶,兰措吉;基于格助词和接续特征的藏文自动分词方案[J];语言文字应用;2003年01期
【共引文献】
中国期刊全文数据库 前7条
1 文庭孝;汉语自动分词研究进展[J];图书与情报;2005年05期
2 刘晓英;汉语自动分词研究的发展趋势[J];高校图书馆工作;2005年04期
3 陈玉忠,李保利,俞士汶;藏文自动分词系统的设计与实现[J];中文信息学报;2003年03期
4 江荻;;现代藏语动词的句法语义分类及相关语法句式[J];中文信息学报;2006年01期
5 文庭孝,侯经川,邱均平,张洋;汉语自动分词新思维:无词典切分[J];情报杂志;2005年02期
6 陈丽娜;祁坤钰;贾彦民;吴健;康丽;;藏文拉丁转写的研究与实现[J];计算机工程与设计;2006年01期
7 文庭孝,邱均平,侯经川;汉语自动分词研究展望[J];现代图书情报技术;2004年07期
中国重要会议论文全文数据库 前9条
1 周学文;郑玉玲;;普通话辅音闭塞段(GAP)时长统计分析[A];第九届全国人机语音通讯学术会议论文集[C];2007年
2 江荻;;现代藏语的句法组块与形式标记[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
3 黄行;江荻;;现代藏语判定动词句主宾语的自动识别方法[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
4 江荻;;现代藏语谓语动词的识别与信息提取[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
5 龙从军;江荻;;现代藏语带助动词的谓语组块及其识别[A];第二届全国学生计算语言学研讨会论文集[C];2004年
6 江荻;;现代藏语动词的句法语义分类及相关语法句式[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
7 江荻;;藏语文本信息处理的历程与进展[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
8 李应兴;付婷;李勇;;基于LUCENE的藏文信息检索的研究与应用[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
9 才智杰;索南仁欠;;藏文分词算法研究[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
中国博士学位论文全文数据库 前1条
1 山丹;蒙古语标准音声学分析[D];内蒙古大学;2007年
中国硕士学位论文全文数据库 前3条
1 陈丽娜;基于OpenOffice.org国际化/本地化框架的藏文办公套件的研究与实现[D];中国农业大学;2005年
2 沈向荣;网络语料库统计分析软件系统的设计及应用[D];广西民族大学;2007年
3 赵军;基于音节统计语言模型蒙古文词汇分析校正器的设计与实现[D];内蒙古大学;2007年
【二级参考文献】
中国期刊全文数据库 前6条
1 何克抗,徐辉,孙波;书面汉语自动分词专家系统设计原理[J];中文信息学报;1991年02期
2 苑春法,陈刚,黄昌宁;基于词性和语义知识的汉语句法规则学习[J];中文信息学报;2001年03期
3 孙茂松,黄昌宁,高海燕,方捷;中文姓名的自动辨识[J];中文信息学报;1995年02期
4 陈玉忠,李保利,俞士汶,兰措吉;基于格助词和接续特征的藏文自动分词方案[J];语言文字应用;2003年01期
5 刘开瑛;现代汉语自动分词评测技术研究[J];语言文字应用;1997年01期
6 陈小荷;自动分词中未登录词问题的一揽子解决方案[J];语言文字应用;1999年03期
中国重要会议论文全文数据库 前2条
1 俞士汶;;计算语言学的应用研究与基础研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
2 黄行;江荻;;现代藏语判定动词句主宾语的自动识别方法[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
【相似文献】
中国重要会议论文全文数据库 前1条
1 毋建军;张俊林;孙乐;吴健;次仁罗布;陈俊杰;;藏文短语及其嵌套短语的提取[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026