收藏本站
《中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集》2006年
收藏 | 手机打开
二维码
手机客户端打开本文

基于最大熵模型的汉语动词与动词搭配识别

王素格  张武  李德玉  杨军玲  彭其伟  
【摘要】:句法分析一直是自然语言处理领域的一个重点和难点问题,准确的动词与动词搭配关系识别可为建立完全的句法分析奠定一定的基础。本文提出了一种基于最大熵模型的汉语动词与动词搭配识别方法,选取目标动词与搭配词的上下文词性信息及其关联程度的统计信息构造候选复合特征模板以及类别信息,利用粗糙集理论中的约简技术,删除复合特征模板中冗余的原子模板,从而获得训练最大熵模型所需的极小模板。四组实验结果表明(1)以同时包含上下文词性信息和统计信息的模板与类别信息模板结合构造的识别模型优于仅含上下文词性信息或统计信息的模板与类别信息模板结合所构造的识别模型;(2)较之搭配定量体系方法,最大熵模型的搭配识别效果较好;(3)结合了粗糙集理论的最大熵方法保证了所构造的模型的简洁性,提高了模型的泛化能力。总之,最大熵模型用于动词与动词搭配识别是可行的。

【参考文献】
中国期刊全文数据库 前4条
1 由丽萍,王素格;汉语动词-动词搭配规则与分布特征[J];计算机工程与应用;2005年23期
2 李素建,刘群,杨志峰;基于最大熵模型的组块分析[J];计算机学报;2003年12期
3 李荣陆,王建会,陈晓云,陶晓鹏,胡运发;使用最大熵模型进行中文文本分类[J];计算机研究与发展;2005年01期
4 叶东毅,陈昭炯;一个新的差别矩阵及其求核方法[J];电子学报;2002年07期
【共引文献】
中国期刊全文数据库 前10条
1 王素格;彭其伟;张武;;基于遗传算法的自然语言参数阈值优化方法[J];测试技术学报;2006年01期
2 詹卫东;80年代以来汉语信息处理研究述评──作为现代汉语语法研究的应用背景之一[J];当代语言学;2000年02期
3 张仰森,徐波,曹元大;自然语言处理中的语言模型及其比较研究[J];广西师范大学学报(自然科学版);2003年01期
4 由丽萍,王素格;汉语动词-动词搭配规则与分布特征[J];计算机工程与应用;2005年23期
5 曲维光,陈小荷,吉根林;基于框架的词语搭配自动抽取方法[J];计算机工程;2004年23期
6 白妙青,郑家恒;动词与动词搭配类型的自动标注方法[J];山西大学学报(自然科学版);2004年01期
7 赵铁军,荀恩东,陈斌,刘小虎,李生;基于目标语统计的译文选择的研究[J];应用基础与工程科学学报;1999年01期
8 王霞;汉语动宾搭配自动识别研究[J];语言文字应用;2005年01期
9 程玉胜;Rosetta实验系统在机器学习中的应用[J];安庆师范学院学报(自然科学版);2005年02期
10 匡乐红;徐林荣;刘宝琛;;组合赋权法确定地质灾害危险性评价指标权重[J];地下空间与工程学报;2006年06期
中国重要会议论文全文数据库 前10条
1 赵晨光;蔡东风;;利用语义特征生成搭配[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 王素格;由丽萍;刘开瑛;;动词与动词搭配自动获取方法[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
3 程涛;施水才;张玉杰;吕学强;;基于大规模语料库的新闻领域新词挖掘[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
4 刘建毅;王菁华;王枞;;基于语言网络的关键词抽取[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
5 Yu Zhengtao~(1,2) Fan Xiaozhong~1 Song Lizhe~1 Guo Jianyi~2 1 Department of Computer Science & Engineering,Beijing Institute of Technology,Beijing,100081,China 2 The School of Information Engineering and Automation & Kunming University of Science and Technology,Kunming,650051,China;Chinese Question Classification Combining Syntactic and Semantic Feature[A];Proceedings of 6th International Symposium on Test and Measurement(Volume 6)[C];2005年
6 李雪红;叶燕华;;水工混凝土结构裂缝主要成因挖掘的粗集方法[A];第五届混凝土结构耐久性科技论坛论文集[C];2006年
7 张志恒;花拥军;;基于粗糙集的数据挖掘技术在企业财务危机预测中的应用[A];全国第九届企业信息化与工业工程学术会议论文集[C];2005年
8 安娜;刘海涛;侯敏;;语料库中熟语的标记问题[A];第三届全国语言文字应用学术研讨会论文集[C];2004年
9 刘明亮;吴跃民;杨明;;基于粗糙集和云理论的土地适宜性评价模型的建立[A];2006年中国土地学会学术年会论文集[C];2006年
10 宋杰鲲;张宇;张在旭;;基于模糊集和粗糙集理论的企业财务危机预警系统[A];第四届中国不确定系统年会论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 杨建国;基于动态流通语料库(DCC)的汉语熟语单位研究[D];北京语言大学;2005年
2 赵春利;形名组合的静态与动态研究[D];暨南大学;2006年
3 赵小兵;基于动态流通语料库的现代汉语基本词汇自动识别与提取方法研究[D];北京语言大学;2007年
4 申修瑛;现代汉语词语搭配研究[D];复旦大学;2007年
5 郭斯羽;动态数据中的数据挖掘研究[D];浙江大学;2002年
6 韩斌;基于数据挖掘的信息融合理论和应用[D];浙江大学;2002年
7 孙国梓;面向企业的产品结构与配置管理关键技术研究[D];南京航空航天大学;2002年
8 苏怀智;大坝安全监控感智融合理论和方法及应用研究[D];河海大学;2002年
9 苏健;基于粗糙集的数据挖掘与决策支持方法研究[D];浙江大学;2002年
10 张燕平;基于商空间的构造性数据挖掘方法及应用[D];安徽大学;2003年
中国硕士学位论文全文数据库 前10条
1 高建忠;汉语动宾搭配的自动识别研究[D];北京语言文化大学;2000年
2 王霞;汉语动宾搭配自动识别研究[D];北京语言文化大学;2003年
3 祁峰;定中式[A单+N]中“形名组合”的选择性研究[D];上海师范大学;2003年
4 由丽萍;动词与动词搭配自动获取方法研究[D];上海师范大学;2003年
5 李剑影;并置理论研究[D];吉林大学;2004年
6 丁淑娟;现代汉语频率副词研究[D];延边大学;2004年
7 梁文娟;汉字语法语义智能输入法搭配库设计与实现[D];河南大学;2006年
8 李铁范;现代汉语方式词研究[D];上海师范大学;2005年
9 田宏梅;基于语料库研究“有点”的搭配与语义分布[D];暨南大学;2006年
10 钱小飞;含“的”最长名词短语的自动识别[D];南京师范大学;2007年
【二级参考文献】
中国期刊全文数据库 前5条
1 叶东毅;Jelonek属性约简算法的一个改进[J];电子学报;2000年12期
2 苗夺谦,胡桂荣;知识约简的一种启发式算法[J];计算机研究与发展;1999年06期
3 周强;规则和统计相结合的汉语词类标注方法[J];中文信息学报;1995年03期
4 赵军,黄昌宁;基于转换的汉语基本名词短语识别模型[J];中文信息学报;1999年02期
5 叶东毅,黄翠微,赵斌;粗糙集中属性约简的一个贪心算法[J];系统工程与电子技术;2000年09期
【相似文献】
中国期刊全文数据库 前10条
1 贾宁;张全;;基于最大熵模型的中文姓名识别[J];计算机工程;2007年09期
2 潘炜;沈超;;面向层次分类标签的词性标注系统[J];计算机工程;2009年21期
3 李荣陆,王建会,陈晓云,陶晓鹏,胡运发;使用最大熵模型进行中文文本分类[J];计算机研究与发展;2005年01期
4 牛晓妍;;基于最大熵的汉语人名识别方法研究[J];福建电脑;2008年04期
5 潘小燕;孙承杰;刘远超;王晓龙;;半结构化文本中的表格识别技术研究[J];微计算机信息;2008年18期
6 李响;才藏太;姜文斌;吕雅娟;刘群;;最大熵和规则相结合的藏文句子边界识别方法[J];中文信息学报;2011年04期
7 陈笑蓉;秦进;;基于最大熵原理的汉语词义消歧[J];计算机科学;2005年05期
8 张晓艳;王挺;陈火旺;;基于混合统计模型的汉语命名实体识别方法[J];计算机工程与科学;2006年06期
9 曹波;苏一丹;邓琦;;基于最大熵模型的中国人名自动识别[J];计算机工程与应用;2009年04期
10 张立岩;吕玲;王井阳;;基于最大熵算法的全文检索研究[J];河北科技大学学报;2009年02期
中国重要会议论文全文数据库 前10条
1 王素格;张武;李德玉;杨军玲;彭其伟;;基于最大熵模型的汉语动词与动词搭配识别[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
2 赵伟;赵法兴;王东海;韩达奇;;一种基于改进的最大熵模型的汉语词性自动标注的新方法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
3 朱江涛;赵丽奎;蔡东风;;基于最大熵模型的中文姓名识别方法初探[A];第二届全国学生计算语言学研讨会论文集[C];2004年
4 肖传芬;;从形式机制谈语篇词汇衔接[A];福建省外国语文学会2005年年会暨学术研讨会论文集[C];2005年
5 冯娟娟;李晗静;李生;;基于句法分析的中文语义角色标注实现[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
6 孙涌;韦小丽;;领域本体构建研究及在专利信息服务中的应用[A];江苏省系统工程学会第十一届学术年会论文集[C];2009年
7 辛霄;范士喜;王轩;王晓龙;;基于最大熵的依存句法分析[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
8 刘方舟;施勤;陶建华;;基于最大熵模型的多音字消歧[A];第九届全国人机语音通讯学术会议论文集[C];2007年
9 于江德;王希杰;余正涛;;基于最大熵模型的语义角色标注[A];2010年全国开放式分布与并行计算机学术会议论文集[C];2010年
10 陈文亮;朱慕华;朱靖波;姚天顺;;基于Bootstrapping的文本分类模型[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
中国重要报纸全文数据库 前10条
1 沈锡伦;语言单位的搭配关系[N];语言文字周报;2007年
2 朱韬 骆宏望;也谈新闻作品的“人情味”[N];战士报;2007年
3 张 冰;要合作就要准备共荣辱[N];中国汽车报;2005年
4 王格;瑞嘉以文化之名为品牌加码[N];北京商报;2007年
5 王连仕;鸡病防治用药应该注意哪些[N];河南科技报;2007年
6 本报记者 张亦嵘 见习记者 唐俊;何时破解身份之惑[N];法制日报;2005年
7 茹桂;不向凡禽求凤毛[N];美术报;2002年
8 殷治纲;语音语料库的建设和作用[N];中国社会科学院院报;2006年
9 马晓年;性角色对夫妻和谐的影响[N];家庭医生报;2006年
10 王远鸿;多角度破解高增长与低物价之谜[N];上海证券报;2006年
中国博士学位论文全文数据库 前10条
1 周雅倩;最大熵方法及其在自然语言处理中的应用[D];复旦大学;2005年
2 李荣陆;文本分类及其相关技术研究[D];复旦大学;2005年
3 秦莉娟;基于内容的自动视频监控研究[D];浙江大学;2006年
4 何奇瑾;我国玉米种植分布与气候关系研究[D];中国气象科学研究院;2012年
5 何奇瑾;我国玉米种植分布与气候关系研究[D];南京信息工程大学;2012年
6 刘文陆;基于激光热凝固效应的眼角膜屈光矫正原理及预测技术研究[D];武汉理工大学;2009年
7 段居琦;我国水稻种植分布及其对气候变化的响应[D];中国气象科学研究院;2012年
8 段居琦;我国水稻种植分布及其对气候变化的响应[D];南京信息工程大学;2012年
9 申修瑛;现代汉语词语搭配研究[D];复旦大学;2007年
10 王宇弘;英汉语通感认知模式对比研究[D];上海交通大学;2009年
中国硕士学位论文全文数据库 前10条
1 梅灿华;基于最大熵模型的迁移学习算法研究[D];合肥工业大学;2011年
2 王慧;最大熵模型的语义句法分析在问答系统中的应用研究[D];大连交通大学;2010年
3 杨芹;基于最大熵模型的中文网页分类器设计和实现[D];苏州大学;2010年
4 戴霞;“V/A+极/死/透/坏+了”的搭配关系考察及教学研究[D];复旦大学;2011年
5 张晓艳;基于混合统计模型的汉语命名实体识别方法的研究与实现[D];国防科学技术大学;2004年
6 乔羽;基于最大熵模型的中文人名识别方法研究[D];山西大学;2005年
7 步海慧;基于最大熵模型的中文姓名识别研究[D];山东大学;2006年
8 郭家清;基于条件随机场的命名实体识别研究[D];沈阳航空工业学院;2007年
9 彭其伟;基于统计方法的中文文本情感倾向分类研究[D];山西大学;2007年
10 杨军玲;汉语动词词语搭配自动获取方法研究[D];山西大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026