收藏本站
《中国计算语言学研究前沿进展(2009-2011)》2011年
收藏 | 手机打开
二维码
手机客户端打开本文

中文CCG树库的构建

宋彦  黄昌宁  揭春雨  
【摘要】:组合范畴语法(CCG)是一种类型驱动的语法,可以高度词例化(lexicalized)并兼顾句法和一定程度上语义的表达,可为深层次的文本分析提供有效支持。将CCG应用于真实文本分析需要编制大规模的词库,为了避免为此付出的昂贵人力和资源,一个行之有效的解决方案是利用现有短语句法树库来自动生成CCG树库。本文提出在清华中文树库的基础上自动生成CCG树库的方案,在预定义的中文句型和基于清华树库的动词子范畴框架的支持下,通过标准转换算法,得到一个包含32737句、超过35万词次的中文CCG树库。该树库通过手工和自动评价验证,又与已有文献报道的多语种CCG树库构建工作比较,均证明本文建议算法的有效性。
【作者单位】:香港城市大学中文、翻译及语言学系 微软亚洲研究院
【分类号】:TP391.1

手机知网App
【参考文献】
中国期刊全文数据库 前1条
1 周强;汉语句法树库标注体系[J];中文信息学报;2004年04期
【共引文献】
中国期刊全文数据库 前10条
1 黄昌宁;李玉梅;;从树库的实践看句本位和中心词分析法的生命力[J];北京师范大学学报(社会科学版);2010年05期
2 李良炎;;新的句法标注模型探索[J];重庆大学学报(社会科学版);2007年03期
3 王跃龙;姬东鸿;;汉语树库综述[J];当代语言学;2009年01期
4 刘知远;郑亚斌;孙茂松;;汉语依存句法网络的复杂网络性质[J];复杂系统与复杂性科学;2008年02期
5 卢俊之;陈小荷;王东波;陈锋;;基于语法功能匹配的汉语句法分析算法[J];计算机工程与应用;2008年16期
6 陈丽江;陈小荷;;统计和规则结合识别动词的跨分句论元[J];计算机工程与应用;2009年16期
7 李良炎;何中市;;句法标注的一般模型与参数分析[J];计算机科学;2007年11期
8 张小艳;邵刚;史月飞;;汉语句法分析中标点符号的运用[J];计算机工程与科学;2009年01期
9 党政法,周强;短语树到依存树的自动转换研究[J];中文信息学报;2005年03期
10 李幸;宗成庆;;引入标点处理的层次化汉语长句句法分析方法[J];中文信息学报;2006年04期
中国重要会议论文全文数据库 前8条
1 李艳娇;杨尔弘;;树库中的歧义组合考察[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 周强;王俊俊;陈丽欧;;构建大规模的汉语事件知识库[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 王跃龙;韩希;;短语结构树到依存树的转换[A];第三届学生计算语言学研讨会论文集[C];2006年
4 满正行;高璐;;藏语单语料库分析及标注探讨[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
5 卢俊之;陈小荷;曲维光;王东波;陈锋;丁德鑫;;基于语法功能匹配的汉语句法分析算法[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
6 钟立军;李茹;彭洪保;;基于汉语多词块的语料库研究[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
7 周强;李玉梅;;汉语块分析评测任务设计[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
8 高松;赵怿怡;刘海涛;;汉语特殊结构的句法标注策略[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
中国博士学位论文全文数据库 前9条
1 姚文琳;汉语依存句法分析方法的研究与实现[D];中国海洋大学;2009年
2 斯·劳格劳;现代蒙古语依存句法自动分析研究[D];内蒙古大学;2011年
3 刘刚;面向领域的软件需求一致性验证方法研究[D];哈尔滨工程大学;2008年
4 孙广路;基于统计学习的中文组块分析技术研究[D];哈尔滨工业大学;2008年
5 杨潇;基于生成性概率模型的句法分析和多文档自动文摘研究[D];山东大学;2009年
6 李军辉;中文句法语义分析及其联合学习机制研究[D];苏州大学;2010年
7 付剑锋;面向事件的知识处理研究[D];上海大学;2010年
8 包敏娜;基于蒙古语影视剧语料库的话语标记研究[D];内蒙古大学;2012年
9 张韬政;结构学习中的辅助问题研究[D];北京邮电大学;2011年
中国硕士学位论文全文数据库 前10条
1 刘金凤;面向自然语言处理的汉语句子语义知识库构建研究[D];鲁东大学;2009年
2 周明海;核心语义角色句法实现的词汇语义制约[D];鲁东大学;2011年
3 袁苾瑜;基于依存树库的英语名词句法研究[D];浙江大学;2011年
4 包萨仁图雅;蒙古语简单句句法结构树库的建设[D];内蒙古大学;2011年
5 朱敬国;基于GLR算法的维吾尔语句法分析研究[D];新疆大学;2011年
6 陈鑫;基于主动学习的汉语依存树库构建[D];哈尔滨工业大学;2011年
7 李雪峰;社保审计领域语料库构建研究[D];哈尔滨工程大学;2011年
8 刘海霞;汉语功能块的自动识别研究[D];大连理工大学;2011年
9 邵刚;基于中文的句法分析系统的研究与实现[D];西安科技大学;2008年
10 程月;现代汉语动宾搭配多角度考察及其自动识别[D];南京师范大学;2008年
【二级参考文献】
中国期刊全文数据库 前2条
1 戴浩一;概念结构与非自主性语法:汉语语法概念系统初探[J];当代语言学;2002年01期
2 周强,张伟,俞士汶;汉语树库的构建[J];中文信息学报;1997年04期
中国重要会议论文全文数据库 前1条
1 周强;;汉语句法知识的自动获取研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
【相似文献】
中国期刊全文数据库 前10条
1 周强;汉语句法树库标注体系[J];中文信息学报;2004年04期
2 张明杰,张跃,姚天顺;一种基于词汇功能描述的树库构建方法[J];东北大学学报(自然科学版);2000年03期
3 周惠巍;黄德根;钱志强;杨元生;;短语结构到依存结构树库转换研究[J];大连理工大学学报;2010年04期
4 刘海涛;赵怿怡;;基于树库的汉语依存句法分析[J];模式识别与人工智能;2009年01期
5 张玥杰;朱靖波;姚天顺;;基于DOP技术实现英汉机译[J];模式识别与人工智能;2003年02期
6 张玥杰,朱靖波,张跃,姚天顺;基于DOP的汉语句法分析技术[J];中文信息学报;2000年01期
7 张杰,牛军钰,孙晓光;基于DOP技术的目标语生成机制[J];小型微型计算机系统;2001年11期
8 张寿萱;SYSTEM C——一个多功能中文信息综合处理系统[J];计算机学报;1984年06期
9 张宝元;抓住机遇 迎接挑战——谈中文信息处理技术及其产品化[J];软件世界;1995年05期
10 ;通联网络[J];中文信息;1996年06期
中国重要会议论文全文数据库 前10条
1 宋彦;黄昌宁;揭春雨;;中文CCG树库的构建[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 张俊萍;;利用CTT的汉语自动分析与对外汉语教学软件的开发[A];第二届全国学生计算语言学研讨会论文集[C];2004年
3 王跃龙;韩希;;短语结构树到依存树的转换[A];第三届学生计算语言学研讨会论文集[C];2006年
4 赵怿怡;关润池;;汉语依存树库的构建[A];第三届学生计算语言学研讨会论文集[C];2006年
5 李素建;刘群;;汉语组块的定义和获取[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
6 张洁;孟遥;于浩;;基于分词性能的汉语语料库比较研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
7 陈鑫;车万翔;刘挺;;基于主动学习的中文依存句法分析[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
8 赵海;揭春雨;宋彦;;基于字依存树的中文词法-句法一体化分析[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
9 练睿婷;史晓东;;语篇标注语料库的建设研究[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
10 郑晓东;陈亮;常宝宝;;一种基于树核的汉语句法分析多重结果重排序技术[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
中国重要报纸全文数据库 前10条
1 记者 刘敬智;我国开发成功中国标准术语数据库[N];光明日报;2000年
2 安徽 张来东;在JAVA开发中的中文处理问题及解决办法[N];中国计算机报;2001年
3 ;专利文献的数字化快车[N];计算机世界;2002年
4 通讯员 林卫菁记者 黄永礼;我省专家首创二键汉字输入法[N];安徽日报;2007年
5 侯雪林;自主创新 迎接拼字文明时代到来[N];大众科技报;2007年
6 林岗;自制中文数字证书[N];计算机世界;2007年
7 陈健;手机汉字输入力推“中国标准”[N];人民日报;2006年
8 ;倪光南:中国软件业既要学印度,更要学美国[N];21世纪经济报道;2006年
9 ;融合世界我和你[N];科技日报;2001年
10 裴高才;钱伟长与电脑汉字输入法研究[N];中华读书报;2010年
中国博士学位论文全文数据库 前10条
1 李军辉;中文句法语义分析及其联合学习机制研究[D];苏州大学;2010年
2 姚文琳;汉语依存句法分析方法的研究与实现[D];中国海洋大学;2009年
3 李荣军;中文商品评论倾向性分析研究[D];北京邮电大学;2011年
4 杨潇;基于生成性概率模型的句法分析和多文档自动文摘研究[D];山东大学;2009年
5 刘兴林;中文词汇知识获取算法和语义计算研究及应用[D];华南理工大学;2012年
6 张毅波;史文结构化信息检索系统的研究与实现[D];中国科学院研究生院(软件研究所);2001年
7 王兰成;基于XMARC信息描述的知识标引与概念检索研究[D];东华大学;2004年
8 周浪;中文术语抽取若干问题研究[D];南京理工大学;2010年
9 孙晓;中文词法分析的研究及其应用[D];大连理工大学;2010年
10 陈毅恒;文本检索结果聚类及类别标签抽取技术研究[D];哈尔滨工业大学;2010年
中国硕士学位论文全文数据库 前10条
1 陈鑫;基于主动学习的汉语依存树库构建[D];哈尔滨工业大学;2011年
2 魏莉;汉语完全句法树库一致性检验方法研究[D];山西大学;2011年
3 孟静;面向句法分析的语块划分体系的研究[D];山西大学;2005年
4 董朝霞;基于无短语标记树库的句法分析方法的研究[D];哈尔滨工业大学;2010年
5 黄李伟;中文零指代消解研究[D];苏州大学;2010年
6 孙静;基于平行语料库的无监督中文词性标注研究[D];苏州大学;2010年
7 刘志超;汉语动宾搭配库构建技术研究[D];沈阳航空航天大学;2011年
8 任晓娜;基于统计的汉语依存句法分析研究[D];沈阳航空航天大学;2011年
9 段恋;基于短语句法结构的树—串汉英对齐模板抽取研究[D];北京邮电大学;2010年
10 卢朝华;基于语义分析的汉语短语识别方法研究[D];河南科技大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026