收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

汉语组块的定义和获取

李素建  刘群  
【摘要】:组块是介于词语和句子之间的一种语言结构,目前还没有明确的定义。本文总结了当前对组块的各种研究,对汉语组块进行了定义。同时组块的获取和收集也是一项迫切的任务,由于不易直接获取到具有组块标注的语料,我们从现有树库中抽取组块。本文根据汉语特点提出了12种汉语组块类型,并根据这些组块类型和宾州大学中文树库短语类型的对应关系进行转化获得组块库。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 李素建,刘群,白硕;统计和规则相结合的汉语组块分析[J];计算机研究与发展;2002年04期
2 李素建,刘群,杨志峰;基于最大熵模型的组块分析[J];计算机学报;2003年12期
3 刘世龙,朱广堂;输电铁塔三维模型生成的改进[J];微机发展;2003年S2期
4 侯晓辉,陈堃銶,贾娟,杨清清;基于设计模式的数据库出版系统的框架模型[J];小型微型计算机系统;2004年11期
5 谭咏梅;王小捷;周延泉;钟义信;;使用SVMs进行汉语浅层分析[J];北京邮电大学学报;2008年01期
6 姜宁;史忠植;;非结构化编辑环境下的增量语法分析[J];计算机科学;2001年12期
7 陈晓明,周渝;汉语部分句法分析的研究和发展趋势[J];贵州大学学报(自然科学版);2004年04期
8 樊勇;郑家恒;;网页去重方法研究[J];计算机工程与应用;2009年12期
9 李堂秋;用大规模并行网络模型同时解决中文分词和语法分析[J];厦门大学学报(自然科学版);1990年02期
10 陈其省;黄建烁;徐秉铮;;英汉旅游翻译系统的研究[J];华南理工大学学报(自然科学版);1990年04期
11 陈兆乾;潘金贵;姚威力;陈世福;;NCFW专家系统的汉语接口[J];计算机研究与发展;1992年01期
12 舒鑫柱,杨尔弘;基于HOWNET的汉语组块分析[J];河南职技师院学报;2001年04期
13 万建成,万芳,孙英明;智能拼音-汉字转换系统实现研究[J];山东大学学报(工学版);2002年05期
14 李迎春,迟呈英,孙冀侠;改进的上下文无关文法及其语法分析[J];鞍山科技大学学报;2003年01期
15 施海昕,佘堃;用于C语言的错误处理预编译器[J];计算机应用;2005年10期
16 靳雁霞;石立丽;刘园;;程序自动编译系统的研制与实现[J];计算机与现代化;2007年09期
17 陈频;;基于自然语言处理的中文科技论文特征提取研究[J];电脑知识与技术(学术交流);2007年16期
18 王水平;郑关胜;谢永华;;《编译原理》课程教学设计探讨[J];气象教育与科技;2007年01期
19 姜文志;聂心东;范洪达;蒋伟俊;;作战命令的语法信息计算模型[J];信息与电子工程;2008年01期
20 李娟;王冬星;;错误处理技术的研究[J];大庆师范学院学报;2008年02期
中国重要会议论文全文数据库 前10条
1 李素建;刘群;;汉语组块的定义和获取[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 刘世岳;李珩;张俐;姚天顺;;Co-training机器学习方法在中文组块识别中的应用[A];第二届全国学生计算语言学研讨会论文集[C];2004年
3 江荻;;现代藏语的句法组块与形式标记[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
4 宋彦;黄昌宁;揭春雨;;中文CCG树库的构建[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
5 张俊萍;;利用CTT的汉语自动分析与对外汉语教学软件的开发[A];第二届全国学生计算语言学研讨会论文集[C];2004年
6 李军辉;周国栋;朱巧明;钱培德;;一种改进的中文层次句法分析模型研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
7 王跃龙;韩希;;短语结构树到依存树的转换[A];第三届学生计算语言学研讨会论文集[C];2006年
8 董文莉;孟洛明;;XML网管接口一致性测试中XML解析器的开发[A];第六届全国计算机应用联合学术会议论文集[C];2002年
9 赵怿怡;关润池;;汉语依存树库的构建[A];第三届学生计算语言学研讨会论文集[C];2006年
10 江荻;;藏语文本信息处理的历程与进展[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
中国博士学位论文全文数据库 前8条
1 李军辉;中文句法语义分析及其联合学习机制研究[D];苏州大学;2010年
2 王胜军;ATLAS语言编译系统[D];吉林大学;2006年
3 徐建国;网络化制造系统中虚拟加工若干关键技术研究[D];南京理工大学;2007年
4 陈毅东;基于短语的统计机器翻译模型若干关键技术研究[D];厦门大学;2008年
5 李素建;汉语组块计算的若干研究[D];中国科学院研究生院(计算技术研究所);2002年
6 张立勇;软件源代码安全分析研究[D];西安电子科技大学;2011年
7 杨潇;基于生成性概率模型的句法分析和多文档自动文摘研究[D];山东大学;2009年
8 姚文琳;汉语依存句法分析方法的研究与实现[D];中国海洋大学;2009年
中国硕士学位论文全文数据库 前10条
1 魏媛;一种应用于文本信息隐藏的组块分析算法的设计与实现[D];西北大学;2012年
2 吴苏红;基于依存关系的旅游景点评论文本倾向分析[D];山西大学;2011年
3 孙慧;基于组块分析的中文短语情感倾向研究[D];哈尔滨工业大学;2010年
4 袁超越;情感组块与机器学习相结合的文本倾向性分析[D];哈尔滨工程大学;2011年
5 李利霞;微型数据库引擎的研究[D];武汉理工大学;2006年
6 闫健恩;基于Windows系统利用Parser Generator实现TTCN -3语言的语法分析器[D];内蒙古大学;2004年
7 刘建军;基于ontology的股票信息抽取系统的研究与实现[D];电子科技大学;2005年
8 尹鹏;基于SVM的中文组块间依存关系分析[D];大连理工大学;2006年
9 李涛;图形用户界面GUI的自动测试工具的研究[D];四川大学;2005年
10 袁晓红;可编程控制器梯形图语言编译器的研究与设计[D];中南大学;2004年
中国重要报纸全文数据库 前3条
1 中国联通大连分公司通信工程师 高红;Oracle数据库参数优化[N];计算机世界;2006年
2 ;IBM优化技术提升DB2性能[N];网络世界;2001年
3 ;1988年世界上第一个英汉机器翻译产品商品化[N];中国计算机报;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978