收藏本站
《第十届全国少数民族语言文字信息处理学术研讨会论文集》2005年
收藏 | 手机打开
二维码
手机客户端打开本文

藏语语料库加工和处理用的藏文切分词典的建立与设计

才藏太  华却才让  
【摘要】:随着自然语言信息处理的不断发展和完善,大规模语料文本处理已经成为计算语言学界的一个热门话题。一个重要的原因是从大规模的语料库中能够提取出所需要的知识。而语料文本的处理与加工以语法信息词典作基础。本文结合《藏语语料自动标注》的开发经验,论述了对藏语语料库切分与标注用的藏文语法信息词典的建立和设计,重点讨论了该词典的内容建设、语法信息的标注、索引结构及查找算法。

手机知网App
【共引文献】
中国期刊全文数据库 前10条
1 樊孝忠,柳林,任锋;汉字智能输入刍议[J];兵工自动化;1995年04期
2 胡明扬;当代语言学[J];广播电视大学学报(哲学社会科学版);2000年04期
3 毕玉德;句法结构的语义模式化问题初探[J];解放军外国语学院学报;2000年01期
4 王逍,张俊华,张榆锋,施心陵;一种基于实时联想的自然语言句子生成方法[J];计算机应用;2002年10期
5 程节华,戴新宇,陈家骏,王启祥;汉英机器翻译中时体态处理[J];计算机应用研究;2004年03期
6 玉素甫·艾白都拉,吾守尔·斯拉木;维语中心语驱动文法句法分析器中的上下文相关处理[J];计算机应用与软件;1999年06期
7 才藏太,华关加;班智达汉藏公文翻译系统中基于二分法的句法分析方法研究[J];中文信息学报;2005年06期
8 毕玉德;关于语义信息处理的语义角色系统的构建[J];民族语文;2003年03期
9 范志新,施伯乐,施兰珍,魏丽君;面向用户的大型图书馆汉语检索系统模型[J];情报学报;1998年03期
10 才智杰;藏汉英电子词典的开发研究[J];青海师范大学学报(自然科学版);2005年02期
中国重要会议论文全文数据库 前3条
1 刘红蕾;;浅谈基于语料库双语词典编纂中词性标注的必要性[A];中国辞书学会双语词典专业委员会第五届年会暨学术研讨会论文集[C];2003年
2 扎洛;索南仁欠;;语言信息处理的现代藏语词性分类方法研究[A];第十届全国少数民族语言文字信息处理学术研讨会论文集[C];2005年
3 才让加;吉太加;;藏语语料库中词性分类代码的确定[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
中国博士学位论文全文数据库 前2条
1 张蕾;概念结构及其应用[D];西北工业大学;2001年
2 赵小兵;基于动态流通语料库的现代汉语基本词汇自动识别与提取方法研究[D];北京语言大学;2007年
中国硕士学位论文全文数据库 前3条
1 黄永文;基于互信息的统计语言模型平滑技术[D];重庆大学;2005年
2 张瑞霞;基于语义的汉语句法分析系统的研究与实现[D];西北大学;2005年
3 刘阳;“隐性小词表+专业小词库”的自动分词技术研究[D];湖南师范大学;2007年
【同被引文献】
中国期刊全文数据库 前5条
1 俞士汶,朱学锋,段慧明;大规模现代汉语标注语料库的加工规范[J];中文信息学报;2000年06期
2 黄昌宁;赵海;;中文分词十年回顾[J];中文信息学报;2007年03期
3 刘华;;超大规模分类语料库构建[J];现代图书情报技术;2006年01期
4 陈玉忠,李保利,俞士汶,兰措吉;基于格助词和接续特征的藏文自动分词方案[J];语言文字应用;2003年01期
5 靳光瑾,郭曙纶,肖航,章云帆;语料库加工中的规范问题——谈《信息处理用现代汉语词类标记集规范》[J];语言文字应用;2003年04期
【相似文献】
中国期刊全文数据库 前10条
1 刘映杰,马义德,刘悦,袁敏,段磊;连续汉语音流中声韵母切分研究[J];甘肃科学学报;2005年03期
2 吴蔚天;田鹤卿;;字典法中的辅助切分规则[J];情报科学;1988年03期
3 刘颖;用隐马尔柯夫模型对汉语进行切分和标注排歧[J];计算机工程与设计;2001年04期
4 刘颖;规则与统计结合分析汉语[J];计算机工程与应用;2002年07期
5 靳从,唐振民,杨静宇;自动标引中自然主题词的切分[J];情报科学;2004年03期
6 贺七一;;黄页分类计算机自动标引的实现[J];中国索引;2004年04期
7 哈力木拉提;;多字体印刷维吾尔文字符识别系统的研究与开发[J];石油工业计算机应用;2002年02期
8 田学东;张艳;王亮;;基于轮廓特征的印刷公式粘连符号的切分[J];计算机工程与应用;2008年04期
9 胡学营;刘慧;陆汝占;;搜索引擎用户查询中的复杂专有名词识别[J];计算机工程与应用;2008年19期
10 何新智;李德才;;磁性液体在传感器中的应用[J];电子测量与仪器学报;2009年11期
中国重要会议论文全文数据库 前4条
1 才藏太;华却才让;;藏语语料库加工和处理用的藏文切分词典的建立与设计[A];第十届全国少数民族语言文字信息处理学术研讨会论文集[C];2005年
2 才让卓玛;;藏文字自动校对系统初探[A];第十届全国少数民族语言文字信息处理学术研讨会论文集[C];2005年
3 姜映映;王绪刚;敖翔;戴国忠;;手写化学公式的在线切分识别[A];第二届和谐人机环境联合学术会议(HHME2006)——第2届中国人机交互学术会议(CHCI'06)论文集[C];2006年
4 满正行;高璐;;藏语单语料库分析及标注探讨[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
中国重要报纸全文数据库 前10条
1 向学培;一把切分市场的刀子[N];中国城乡金融报;2001年
2 王以超;谁来切分中国“潘多拉蛋糕”?[N];科技日报;2001年
3 林红梅;春运“大蛋糕”会怎样切分?[N];厂长经理日报;2002年
4 本报记者 张仲超;上海物流业蛋糕不小 四千五百亿等待切分[N];中国商报;2001年
5 阎玉萍;西气东输千余亿“蛋糕”如何切分[N];中华建筑报;2002年
6 孙蔚 本报记者 乔国栋;中国待切分时度假蛋糕[N];中国经济时报;2002年
7 本报记者 焦集莹;国产数码相机:蛋糕如何切分[N];中国电子报;2002年
8 列铭;车险奶酪明年重新切分?[N];中国商报;2002年
9 本报记者 李春喜;开发银行遭遇越界指责 银行业蛋糕切分引发交锋[N];中国经营报;2001年
10 记者 赖迎春 李格文;零售巨鲸切分重庆商业蛋糕?[N];重庆商报;2001年
中国博士学位论文全文数据库 前1条
1 孙羽菲;低质量文本图像OCR技术的研究[D];中国科学院研究生院(计算技术研究所);2005年
中国硕士学位论文全文数据库 前5条
1 普次仁;藏文文字识别技术研究[D];西藏大学;2008年
2 胡学营;信息检索中语段形式用户需求的分析[D];上海交通大学;2008年
3 齐晶;纳米尺度下光学邻近校正的预处理与后验证研究[D];浙江大学;2012年
4 李恩净;韩国留学生汉语阅读理解中的切分问题研究[D];山东师范大学;2011年
5 朱福全;英汉翻译中翻译方法的思考[D];上海交通大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026