收藏本站
《中国计算机语言学研究前沿进展(2007-2009)》2009年
收藏 | 手机打开
二维码
手机客户端打开本文

基于最大间隔马尔可夫网模型的汉语分词方法

李月伦  常宝宝  
【摘要】:分词是汉语自然语言处理研究中非常重要的一个环节,在早先的研究中,最大熵模型和条件随机场(CRF)模型已经广泛运用到汉语自动分词的工作中。最大间隔马尔可夫网(Max Margin Markov Networks,简称M3N)模型是近年来由B.Taskar等人提出的一种新型结构学习模型。本文尝试将该模型用于汉语分词建模,通过一组实验证明基于最大间隔马尔科夫网模型的汉语分词方法可以取得较高的分词精度,是一种有效的汉语分词方法。

手机知网App
【参考文献】
中国期刊全文数据库 前3条
1 孙茂松,肖明,邹嘉彦;基于无指导学习策略的无词表条件下的汉语自动分词[J];计算机学报;2004年06期
2 李双龙;刘群;王成耀;;基于条件随机场的汉语分词系统[J];微计算机信息;2006年28期
3 黄昌宁;赵海;;中文分词十年回顾[J];中文信息学报;2007年03期
【共引文献】
中国期刊全文数据库 前1条
1 刘迁;贾惠波;;中文信息处理中自动分词技术的研究与展望[J];计算机工程与应用;2006年03期
中国重要会议论文全文数据库 前3条
1 赵军;敖其尔;吉仁尼格;巩政;葡萄;陈建东;;基于统计语言模型蒙古文词汇分析校正器的设计与实现[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
2 王思力;王斌;;基于双字耦合度的中文分词交叉歧义处理方法[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
3 高嵩;周强;;一种中文分词后处理反馈算法[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
中国博士学位论文全文数据库 前4条
1 刘华;基于关键短语的文本内容标引研究[D];北京语言大学;2005年
2 杨传耀;中文信息检索索引模型及相关技术研究[D];复旦大学;2007年
3 高红;基于统计语言模型的汉语浅层分析研究[D];大连理工大学;2007年
4 宗校军;中文网页定题采集及分类研究[D];华中科技大学;2006年
中国硕士学位论文全文数据库 前10条
1 杨超;基于最大匹配的书面汉语自动分词研究[D];湖南大学;2004年
2 张晓淼;基于神经网络的中文分词算法的研究[D];大连理工大学;2006年
3 熊冬明;汉语自动分词和中文人名识别技术研究[D];浙江大学;2006年
4 马晓娜;用于考古数字博物馆的受限自然语言查询系统[D];山东大学;2005年
5 王思力;面向大规模信息检索的中文分词技术研究[D];中国科学院研究生院(计算技术研究所);2006年
6 黄鑫;无指导学习下基于修正词频库的分词方法研究[D];重庆大学;2006年
7 夏俊鸾;一个基于分类规则发现的汉语消歧方法的设计与实现[D];苏州大学;2006年
8 郭翠珍;基于网格的分词服务系统的研究与实现[D];苏州大学;2006年
9 王广正;基于知网语义相关度计算的汉语自动分词方法的研究[D];云南师范大学;2006年
10 李建超;网页在线聚类的研究与实现[D];上海交通大学;2007年
【二级参考文献】
中国期刊全文数据库 前5条
1 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
2 杨尔弘;方莹;刘冬明;乔羽;;汉语自动分词和词性标注评测[J];中文信息学报;2006年01期
3 周文帅;冯速;;汉语分词技术研究现状与应用展望[J];山西师范大学学报(自然科学版);2006年01期
4 金春实;丁晓青;彭良瑞;刘长松;;基于词素的日文分词方法及其在OCR系统中的应用[J];微计算机信息;2006年03期
5 刘开瑛;现代汉语自动分词评测技术研究[J];语言文字应用;1997年01期
【相似文献】
中国期刊全文数据库 前10条
1 赵晓凡;胡顺义;刘永革;;CRF模型中参数f在字标注汉语分词中的适用性研究[J];郑州大学学报(工学版);2011年04期
2 高东平;;基于类型论的汉语分词系统TTCS[J];重庆理工大学学报(社会科学);2011年08期
3 史晓东;卢亚军;;央金藏文分词系统[J];中文信息学报;2011年04期
4 张利江;郭进利;李松伟;;河南省县级医院网上信息服务现状调查研究[J];价值工程;2011年21期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 李月伦;常宝宝;;基于最大间隔马尔可夫网模型的汉语分词方法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
2 李博渊;奚宁;黄书剑;张建兵;陈家骏;;一种适用于机器翻译的汉语分词方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 陈鄞;赵铁军;吕雅娟;于浩;;汉英机器翻译中数词的识别和翻译[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
4 徐冰;姚建民;杨沐昀;赵铁军;;汉语分词在机器翻译评价中的影响[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
5 万升华;杨沐昀;李生;赵铁军;;基于字词混合翻译短语的统计机器翻译[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
6 付国宏;王晓龙;龚永红;;基于词形的汉语文本切分方法[A];第五届全国人机语音通讯学术会议论文集[C];1998年
7 李双龙;刘乐中;刘群;;利用单字碎片过滤改进汉语分词性能[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
8 李晶;陈鄞;杨沐昀;徐冰;;关于在分词系统中引入领域词典的研究[A];第二届全国学生计算语言学研讨会论文集[C];2004年
9 高山;张艳;徐波;宗成庆;韩兆兵;;基于三元统计模型的汉语分词及标注一体化研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
10 穆飞;李维佳;薛巍;舒继武;;一种分布式信息检索系统的设计与实现[A];全国网络与信息安全技术研讨会论文集(下册)[C];2007年
中国重要报纸全文数据库 前1条
1 记者 侯梅竹;汉语语料检索系统问世[N];计算机世界;2004年
中国博士学位论文全文数据库 前2条
1 张华平;语言浅层分析与句子级新信息检测研究[D];中国科学院研究生院(计算技术研究所);2005年
2 王斯日古楞;基于混合策略的汉蒙机器翻译及相关技术研究[D];内蒙古大学;2009年
中国硕士学位论文全文数据库 前10条
1 苏勇;基于理解的汉语分词系统的设计与实现[D];电子科技大学;2011年
2 蒋龙;基于统计的汉语分词在机械产品设计中的应用[D];西安电子科技大学;2012年
3 王红雨;网络教学汉语答疑系统关键技术的研究与应用[D];大连理工大学;2006年
4 周波;汉语语言处理中专有名词的提取和识别[D];电子科技大学;2006年
5 李楠;基于遗传算法的汉语文本主题词提取研究[D];吉林大学;2007年
6 冯蜀茗;网络环境下协作学习监控研究[D];西南师范大学;2005年
7 郭翠珍;基于网格的分词服务系统的研究与实现[D];苏州大学;2006年
8 吴雪敏;汉语语句的计算机分析[D];电子科技大学;2001年
9 于长远;应用条件随机场进行汉语分词和词性标注的研究[D];辽宁科技大学;2008年
10 沈勤中;基于条件随机场的汉语分词研究[D];苏州大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026