收藏本站
《中国计算机语言学研究前沿进展(2007-2009)》2009年
收藏 | 手机打开
二维码
手机客户端打开本文

基于多分类器集成的古代汉语词义消歧

于丽丽  丁德鑫  曲维光  陈小荷  石民  
【摘要】:本文首先分析了古代汉语词义义项特点,考察了词义消歧的难点,确定出面向汉语信息处理的词语义项区分遵循的原则和方法。然后在现有的词义消歧理论基础上,采用机器学习的方法,选择合适的特征,使用高效率的NaiveBayes、RFR_SUM、最大熵以及CRF等分类模型,对"将"、"如"、"我"、"信"、"闻"等高频词进行了词义消歧实验。最后采用分类集成的方法,研究了乘法法则、均值法则、最大值法则三种集成法则在古汉语词义消歧中的应用。集成实验最好平均F值达到了84.10%,实验结果表明,分类器的集成对古汉语词义消歧效果良好。

【参考文献】
中国期刊全文数据库 前1条
1 吴云芳;俞士汶;;信息处理用词语义项区分的原则和方法[J];语言文字应用;2006年02期
【共引文献】
中国期刊全文数据库 前10条
1 张劲秋;据境索义与文言词语训释[J];安徽教育学院学报;2005年02期
2 萧国政;胡惮;;信息处理的汉语语义资源建设现状分析与前景展望[J];长江学术;2007年02期
3 卢志茂;刘挺;李生;;统计词义消歧的研究进展[J];电子学报;2006年02期
4 查中林;说“辟”字词族[J];四川师范学院学报(哲学社会科学版);2002年03期
5 宋永培;文献正文的训诂与专书词汇研究的基本方法[J];古汉语研究;2005年02期
6 温美姬,温昌衍;“爸”、“妈"读音小考[J];古汉语研究;2005年03期
7 李剑萍;20世纪中国学制问题的历史研究[J];华东师范大学学报(教育科学版);2002年03期
8 张会;网络汉字词简析[J];广西社会科学;2002年02期
9 曾昭聪;《颜氏家训》中的词源探求[J];广西社会科学;2005年11期
10 张会;古今汉字理据的差异[J];广西社会科学;2005年11期
中国重要会议论文全文数据库 前10条
1 罗玲玲;;浅议工程技术活动中的设计哲学[A];第6届东亚科技与社会(STS)国际学术会议论文摘要集[C];2005年
2 宋彬;;《武当山历代志书集注·第一辑》献疑[A];汉水文化研究——汉水文化暨武当文化国际学术讨论会论文集[C];2004年
3 郑冰寒;陈瑶;;“Blog”译名问题探究[A];中国英汉语比较研究会第七次全国学术研讨会论文集[C];2006年
4 全昌勤;何婷婷;姬东鸿;;基于义类的无导词义消歧方法的研究[A];第二届全国学生计算语言学研讨会论文集[C];2004年
5 陈浩;何婷婷;代玲;;基于向量空间模型的无导词义消歧[A];第二届全国学生计算语言学研讨会论文集[C];2004年
6 王萌;何婷婷;王晓荣;;基于hownet概念获取的中文自动文摘系统[A];第二届全国学生计算语言学研讨会论文集[C];2004年
7 曲维光;董宇;陈钟;陈小荷;;基于语境计算模型的词义消歧[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
8 张仰森;俞士汶;段惠明;吴云芳;;汉语词义自动标注研究软件平台的设计与实现[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
9 裴雨来;吴云芳;;对几种义项区分方法的讨论:以动词擦为例[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
10 昝红英;张坤丽;柴玉梅;俞士汶;;现代汉语虚词知识库的研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
中国博士学位论文全文数据库 前7条
1 潘世松;不同年龄段语用主体语体特征研究[D];复旦大学;2003年
2 于立贤;三大球魅力的价值学研究[D];北京体育大学;2002年
3 金前文;汉赋与汉代《诗经》学[D];华中师范大学;2006年
4 包诗林;于省吾《新证》训诂研究[D];安徽大学;2007年
5 刘精盛;王念孙的训诂理论与实践研究[D];陕西师范大学;2007年
6 段建勇;多词表达抽取及其应用[D];上海交通大学;2007年
7 何瑞雄;以公平和效率为导向的政府管理审计研究[D];厦门大学;2007年
中国硕士学位论文全文数据库 前10条
1 杨小平;《三国志》中的复音虚词[D];四川师范大学;2001年
2 高雷;网络智能过滤系统的设计与实现[D];广东工业大学;2003年
3 林长真;双关语英汉对比研究[D];吉林大学;2004年
4 金小平;反训研究[D];内蒙古大学;2004年
5 包克菲;古汉语词义个体两重性特征探析[D];内蒙古大学;2004年
6 刘亚清;基于词义的汉语排歧方法研究[D];南京理工大学;2004年
7 范丽清;语感本质探求与语感培养策略研究[D];内蒙古师范大学;2004年
8 陈世栋;中国古锁吉祥寓意研究[D];江南大学;2004年
9 周满伟;邢昺语言学研究[D];山东师范大学;2004年
10 程艳梅;贾公彦语言学研究[D];山东师范大学;2004年
【二级参考文献】
中国期刊全文数据库 前6条
1 潘竟翰;义项的属性与界定[J];辞书研究;2000年05期
2 肖云,孙茂松,邹嘉彦;利用上下文信息解决汉语自动分词中的组合型歧义[J];计算机工程与应用;2001年19期
3 曲维光;吉根林;穗志方;周俊生;;基于语境信息的组合型分词歧义消解方法[J];计算机工程;2006年17期
4 冯素琴;陈惠明;;一种自组织的汉语组合型歧义消歧方法[J];计算机工程与设计;2007年03期
5 崔应贤;;也谈比喻和比较的区别[J];修辞学习;2005年06期
6 田兵;多义词的认知语义框架与词典使用者的接受视野——探索多义词义项划分和释义的认知语言学模式(一)[J];现代外语;2003年04期
中国硕士学位论文全文数据库 前1条
1 廉竹钧;汉语组合型切分歧义字段消歧方法研究[D];北京语言文化大学;2002年
【相似文献】
中国期刊全文数据库 前10条
1 肖瑜;何红梅;;古代汉语类单机版全文数据库资源简介——古代汉语类课程建设与优质教学资源开发研究系列论文之二[J];广西大学学报(哲学社会科学版);2011年S1期
2 杨撼岳;陈笑蓉;郑高山;;水族文字笔形编码方法研究[J];计算机工程;2011年14期
3 彭成;季培培;;基于确定性退火的中文术语语义层次关联研究[J];计算机应用研究;2011年09期
4 张野;杨建林;;基于KNN和SVM的中文文本自动分类研究[J];情报科学;2011年09期
5 王伟;赵东岩;赵伟;;中文新闻关键事件的主题句识别[J];北京大学学报(自然科学版);2011年05期
6 张延良;;多媒体环境下启发式教学在通信原理课程中的应用研究[J];大众科技;2011年06期
7 顾潇华;姜亦强;崔涛;;中文自动标引、全文检索及中文搜索引擎三者关系的探讨[J];图书馆学研究;2011年17期
8 张尊生;;《信息技术 信息交换用汉字编码字符集 基本集的扩充》和《信息技术 数字键盘汉字输入通用要求》国家标准发布[J];中国标准导报;2000年03期
9 赵晓凡;胡顺义;刘永革;;CRF模型中参数f在字标注汉语分词中的适用性研究[J];郑州大学学报(工学版);2011年04期
10 夏剑钦;;出版专业职业资格考试辅导教材《出版专业基础·初级》修订情况述要[J];中国编辑;2011年04期
中国重要会议论文全文数据库 前10条
1 于丽丽;丁德鑫;曲维光;陈小荷;石民;;基于多分类器集成的古代汉语词义消歧[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
2 ;中国中文信息学会交流材料[A];2011年网络学术交流研讨会交流材料[C];2011年
3 周晓燕;;独立学院古代汉语课程教学的改革与创新[A];“高教强省”探索与实践——高教科研2008[C];2009年
4 孙玉芳;;中文信息处理与国家信息化建设[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
5 陈文亮;朱靖波;吕学强;姚天顺;;词性标注规则的获取和优化[A];第一届学生计算语言学研讨会论文集[C];2002年
6 ;前言[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
7 刘春荣;;我国当务之急是解决中文书写方式的根本变革[A];中国中文信息学会汉字编码专业委员会第九届年会暨学术研讨会论文集[C];2011年
8 李毅;亢世勇;孙茂松;孙道功;;基于奥运语料的语义成分标注规范[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
9 李竹;;中文信息处理与现代汉语词类研究[A];世纪之交的中国应用语言学研究——第二届全国语言文字应用学术研讨会论文集[C];1998年
10 陈志云;;高师“古代汉语”课程教学改革刍议[A];江西省语言学会2008年年会论文集[C];2008年
中国重要报纸全文数据库 前10条
1 记者 梁捷;我国中文信息处理技术从实验室走向全面应用[N];光明日报;2009年
2 姚双云 华中师范大学语言与语言教育研究中心;虚词知识库:中文信息处理的基石[N];中国社会科学报;2011年
3 倪光南;活力重现的中文信息处理[N];计算机世界;2001年
4 齐悦;速记界泰斗唐亚伟 获中文信息处理领域最高科技奖[N];中国质量报;2006年
5 本报记者 赵志研;从古代汉语的演变看民族关系的发展[N];中国民族报;2009年
6 张波 龙雨;中文信息处理国际学术会议在武汉大学召开[N];中国社会科学院院报;2007年
7 刘永耕;王力“古代汉语”注释商榷一例[N];语言文字周报;2009年
8 记者 段佳;中文信息处理技术加速前行[N];大众科技报;2009年
9 记者 韩晓玲通讯员 张波 龙雨;海内外专家聚焦中文信息处理[N];湖北日报;2007年
10 时永乐门凤超;王力与《古代汉语》[N];光明日报;2008年
中国博士学位论文全文数据库 前10条
1 刘福根;古代汉语詈语小史[D];浙江大学;2007年
2 曹凤霞;古代汉语标记被动式研究[D];吉林大学;2012年
3 宋春阳;面向信息处理的现代汉语“名+名”逻辑语义研究[D];上海师范大学;2003年
4 由丽萍;构建现代汉语框架语义知识库技术研究[D];上海师范大学;2006年
5 周卫华;面向中文信息处理的现代汉语动宾语义搭配研究[D];华中师范大学;2007年
6 詹卫东;面向中文信息处理的现代汉语短语结构规则研究[D];北京大学;1999年
7 李琼;汉语复句书读前后语言片段的非分句识别[D];华中师范大学;2008年
8 吕艳辉;基于语料库的现代汉语手部动词研究[D];山东大学;2008年
9 陈慧;基于DCC动态流通语料库的中文组织名考察与研究[D];北京语言大学;2008年
10 刘磊;概念内涵属性计算研究[D];上海交通大学;2011年
中国硕士学位论文全文数据库 前10条
1 陶东成;基于Linux和XIM协议的中文输入法服务器的实现及其应用[D];苏州大学;2004年
2 罗忠毅;数字化中医古籍的理想模式及其相关问题研究[D];成都中医药大学;2005年
3 王敏;基于改进的隐马尔科夫模型汉语词性标注[D];山西大学;2007年
4 党兰学;汉字语法语义智能输入法总体设计与部分实现[D];河南大学;2006年
5 傅成宏;现代汉语兼语结构的自动识别[D];南京师范大学;2007年
6 白晓梅;校园网中文搜索引掣系统的设计与实现[D];吉林大学;2006年
7 曹林峰;中文文字差错率统计软件的实现[D];西安电子科技大学;2007年
8 刘桂梅;周有光语文改革思想研究[D];山东师范大学;2005年
9 张玉华;基于码本的输入法评测系统的设计和实现[D];苏州大学;2005年
10 杜莹;汉字语法语义智能输入法核心算法及实现技术[D];河南大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026