收藏本站
《语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集》2003年
收藏 | 手机打开
二维码
手机客户端打开本文

汉语组块的定义和获取

李素建  刘群  
【摘要】:组块是介于词语和句子之间的一种语言结构,目前还没有明确的定义。本文总结了当前对组块的各种研究,对汉语组块进行了定义。同时组块的获取和收集也是一项迫切的任务,由于不易直接获取到具有组块标注的语料,我们从现有树库中抽取组块。本文根据汉语特点提出了12种汉语组块类型,并根据这些组块类型和宾州大学中文树库短语类型的对应关系进行转化获得组块库。
【作者单位】:北京大学计算语言学研究所 北京大学计算语言学研究所
【分类号】:TP391.1

手机知网App
【引证文献】
中国硕士学位论文全文数据库 前1条
1 王莹莹;汉语组块识别的研究[D];大连理工大学;2006年
【共引文献】
中国期刊全文数据库 前7条
1 李素建,刘群,白硕;统计和规则相结合的汉语组块分析[J];计算机研究与发展;2002年04期
2 周雅倩,郭以昆,黄萱菁,吴立德;基于最大熵方法的中英文基本名词短语识别[J];计算机研究与发展;2003年03期
3 李素建,刘群,杨志峰;基于最大熵模型的组块分析[J];计算机学报;2003年12期
4 牛正雨,柴佩琪;基于边界点词性特征统计的韵律短语切分[J];中文信息学报;2001年05期
5 刘冬明,赵军,杨尔弘;汉英双语语料库中名词短语的自动对应[J];中文信息学报;2003年05期
6 詹红斌,肖人彬;面向智能设计的仿自然汉语程序设计语言[J];小型微型计算机系统;2002年06期
7 冯冲;陈肇雄;黄河燕;张亮;王江伟;;基于条件随机域的复杂最长名词短语识别[J];小型微型计算机系统;2006年06期
中国重要会议论文全文数据库 前6条
1 周强;詹卫东;任海波;;构建大规模的汉语语块库[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 周强;;汉语部分分析研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
3 彭国珍;邹纲;;基于汉英双语语料库述宾短语的自动抽取[A];第二届全国学生计算语言学研讨会论文集[C];2004年
4 Yanjun MA Ying LIU Lab of Computational Linguistics, Department of Chinese Language and Literature, Tsinghua University, Beijing, 100084;Chinese-English Quasi-equivalent Noun Phrase:Definition and Automatic Identification[A];Proceedings of 2005 IEEE International Conference on Natural Language Processing and Knowledge Engineering[C];2005年
5 马艳军;刘颖;;汉英准等价名词短语[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
6 钱小飞;陈小荷;;含“的”字偏正结构的最长名词短语的自动识别[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
中国博士学位论文全文数据库 前9条
1 隋岩;基于“动态流通语料库”的“有效字符串”提取研究[D];北京语言大学;2004年
2 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
3 杨建国;基于动态流通语料库(DCC)的汉语熟语单位研究[D];北京语言大学;2005年
4 余传明;基于本体的语义信息系统研究[D];武汉大学;2005年
5 于满泉;面向人物追踪的知识挖掘研究[D];中国科学院研究生院(计算技术研究所);2006年
6 史艳岚;基于中国主流报纸动态流通语料库的对外汉语报刊新闻主题词群及相关研究[D];北京语言大学;2006年
7 李素建;汉语组块计算的若干研究[D];中国科学院研究生院(计算技术研究所);2002年
8 姜韶华;科研项目管理中的文本挖掘方法研究及应用[D];大连理工大学;2006年
9 傅魁;基于Web的本体学习研究[D];武汉理工大学;2007年
中国硕士学位论文全文数据库 前10条
1 黄元萃;汉语基本名词短语的自动识别模型[D];大连理工大学;2001年
2 张海燕;基于分词的中文文本自动分类研究与实现[D];湖南大学;2002年
3 耿春霞;基于机械设计领域的汉语句法分析研究[D];西安电子科技大学;2004年
4 刘冬明;汉英双语平行语料库中对齐方法的研究[D];山西大学;2004年
5 孟迎;基于统计的机器学习的中文命名实体识别[D];昆明理工大学;2004年
6 庄明;装备发展战略研究信息化平台中汉语文本信息提取技术的研究[D];国防科学技术大学;2003年
7 张瑞霞;基于语义的汉语句法分析系统的研究与实现[D];西北大学;2005年
8 张惠春;面向框架语义的汉语短语自动识别研究[D];山西大学;2006年
9 于浚涛;基于最大熵的汉语介词短语自动识别[D];大连理工大学;2006年
10 周俏丽;面向汉语单句的依存句法分析研究[D];沈阳航空工业学院;2006年
【同被引文献】
中国期刊全文数据库 前10条
1 孙宏林,俞士汶;浅层句法分析方法概述[J];当代语言学;2000年02期
2 李素建,刘群,白硕;统计和规则相结合的汉语组块分析[J];计算机研究与发展;2002年04期
3 周雅倩,郭以昆,黄萱菁,吴立德;基于最大熵方法的中英文基本名词短语识别[J];计算机研究与发展;2003年03期
4 王荣波,池哲儒;基于神经元网络的汉语组块自动划分[J];计算机工程;2004年20期
5 周强,孙茂松,黄昌宁;汉语句子的组块分析体系[J];计算机学报;1999年11期
6 李素建,刘群,杨志峰;基于最大熵模型的组块分析[J];计算机学报;2003年12期
7 刘芳,赵铁军,于浩,杨沐昀,方高林;基于统计的汉语组块分析[J];中文信息学报;2000年06期
8 俞士汶,朱学锋,段慧明;大规模现代汉语标注语料库的加工规范[J];中文信息学报;2000年06期
9 奚晨海,孙茂松;基于神经元网络的汉语短语边界识别[J];中文信息学报;2002年02期
10 李珩,朱靖波,姚天顺;基于SVM的中文组块分析[J];中文信息学报;2004年02期
中国博士学位论文全文数据库 前1条
1 毛勇;基于支持向量机的特征选择方法的研究与应用[D];浙江大学;2006年
中国硕士学位论文全文数据库 前2条
1 沈培华;支持矢量机的算法研究和应用[D];南京理工大学;2002年
2 梁以敏;基于统计的汉语词性标注方法的研究[D];大连理工大学;2004年
【二级引证文献】
中国硕士学位论文全文数据库 前1条
1 罗雪兵;汉语组块识别的研究[D];大连理工大学;2007年
【相似文献】
中国期刊全文数据库 前10条
1 谭国平;倪新洋;季敏;马赛赛;;一种基于网络编码的移动自组网实时多播协议[J];微电子学与计算机;2011年08期
2 ;[J];;年期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 李素建;刘群;;汉语组块的定义和获取[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 范模;李达;马巍巍;易丛;白雪平;;南海超大型组块浮托的总体设计与关键技术[A];第十三届中国科协年会第13分会场-海洋工程装备发展论坛论文集[C];2011年
3 刘世岳;李珩;张俐;姚天顺;;Co-training机器学习方法在中文组块识别中的应用[A];第二届全国学生计算语言学研讨会论文集[C];2004年
4 刘超;刘全刚;郭宁;李挺;;海洋平台建造过程中的牵引滑移研究[A];第十五届中国海洋(岸)工程学术讨论会论文集(下)[C];2011年
5 左胜;;秦皇岛32-6油田井口平台组块吊装工艺[A];2003年度海洋工程学术会议论文集[C];2003年
6 刘明爽;胆雯;;渤中34-1N WHPC组块称重结构物设计及有限元分析[A];第十五届中国海洋(岸)工程学术讨论会论文集(下)[C];2011年
7 任登君;李珩;张俐;姚天顺;;基于词对齐的双语组块对齐[A];第二届全国学生计算语言学研讨会论文集[C];2004年
8 宋彦;黄昌宁;揭春雨;;中文CCG树库的构建[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
9 江荻;;现代藏语的句法组块与形式标记[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
10 王茂林;;自然口语中的韵律组块过程[A];新世纪的现代语音学——第五届全国现代语音学学术会议论文集[C];2001年
中国重要报纸全文数据库 前10条
1 ;蓝疆号完成海上吊装[N];中国证券报;2003年
2 记者 齐芳;“顿悟”是怎么发生的[N];光明日报;2011年
3 记者 梁利华;北京应用透水树脂组块进行树池铺装[N];中国环境报;2004年
4 本报记者 殷元元;城在青山绿水间 人在鸟语花香中[N];黄山日报;2007年
5 本报记者  陈袆淼;亚洲最大海洋石油工程制造场地一期竣工投产[N];中国工业报;2006年
6 记者 朱磊;亚洲最大海洋石油工程制造场地投产[N];经济日报;2006年
7 执笔 江荻;人文社会科学前沿扫描[N];中国社会科学院院报;2008年
8 钱海燕;分组学词语 省时又高效[N];中国教师报;2005年
9 温偬;中海油青岛海工制造场地投产[N];中国船舶报;2006年
10 通讯员 张洁本报记者 相晓冬;海油工程展开深海发展蓝图[N];中国企业报;2008年
中国博士学位论文全文数据库 前10条
1 祁乐瑛;表象表征:心理旋转的实证探索[D];华东师范大学;2009年
2 斯·劳格劳;现代蒙古语依存句法自动分析研究[D];内蒙古大学;2011年
3 李军辉;中文句法语义分析及其联合学习机制研究[D];苏州大学;2010年
4 王乃弋;数学算式结构加工的ERP研究[D];西南大学;2008年
5 关守义;内隐学习中的知识习得及其无意识性测量[D];华东师范大学;2012年
6 陈毅东;基于短语的统计机器翻译模型若干关键技术研究[D];厦门大学;2008年
7 王茂林;普通话自然话语的韵律模式[D];中国社会科学院研究生院;2003年
8 张兰兰;汉语阅读过程中心理词加工机制的实验研究[D];天津师范大学;2012年
9 孙华平;臂丛损伤神经移位术后运动皮层重组的功能磁共振研究[D];复旦大学;2005年
10 唐菁华;内隐学习中知识及其意识水平测量[D];华东师范大学;2010年
中国硕士学位论文全文数据库 前10条
1 张瑛;汉语树库中空语类标注[D];四川外语学院;2012年
2 宋宏珂;工作记忆个体差异和记忆负荷对组块加工的影响[D];西南大学;2010年
3 包萨仁图雅;蒙古语简单句句法结构树库的建设[D];内蒙古大学;2011年
4 袁苾瑜;基于依存树库的英语名词句法研究[D];浙江大学;2011年
5 陈鑫;基于主动学习的汉语依存树库构建[D];哈尔滨工业大学;2011年
6 魏莉;汉语完全句法树库一致性检验方法研究[D];山西大学;2011年
7 魏媛;一种应用于文本信息隐藏的组块分析算法的设计与实现[D];西北大学;2012年
8 张宁;组块构建记忆策略训练提高初中学生英语词汇学习质量的应用研究[D];山东师范大学;2010年
9 吴苏红;基于依存关系的旅游景点评论文本倾向分析[D];山西大学;2011年
10 孙慧;基于组块分析的中文短语情感倾向研究[D];哈尔滨工业大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026