收藏本站
《自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集》2001年
收藏 | 手机打开
二维码
手机客户端打开本文

基于三元统计模型的汉语分词及标注一体化研究

高山  张艳  徐波  宗成庆  韩兆兵  
【摘要】:汉语的分词及词性标注是汉语语言处理的基础.虽然,该领域在过去十年已经有了很大进展,但高精度的面向大规模真实文本的分词及标注仍然存在许多困难.本文提出一种基于三元统计模型的汉语分词标注的方法,旨在并行考虑词性及词汇的三元概率模型,兼顾词及词性之间的搭配,实现分词和78类二级词性标注的整体最优,实验结果显示该方法获得很高的正确率.

【相似文献】
中国期刊全文数据库 前10条
1 张统宣;;高等师范学校古代汉语教学语料库建设[J];价值工程;2011年22期
2 ;[J];;年期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 李优;;支持向量机在组块识别中的应用[A];第八届中国青年运筹信息管理学者大会论文集[C];2006年
2 高山;张艳;徐波;宗成庆;韩兆兵;;基于三元统计模型的汉语分词及标注一体化研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
3 余水生;王保林;游坚;张文祥;;柳钢焦炭热性能对高炉冶炼影响的统计模型及分析[A];第八届全国冶金工艺理论学术会议论文专辑[C];2005年
4 刘实;王宁;朱其文;王新国;胡中明;陈长胜;;长春市空气污染潜势预报的统计模型研究[A];城市气象服务科学讨论会学术论文集[C];2001年
5 李斌;姚康泽;王岩;;基于高分辨距离像统计模型的雷达目标识别[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(上册)[C];2008年
6 赵春;张进平;贾金生;卢正超;;包含首蓄因子的心墙土石坝水平位移统计模型研究[A];中国水利学会第三届青年科技论坛论文集[C];2007年
7 陈永胜;刘小明;任福田;张黔芳;;道路安全设计支持平台之统计模型的研究[A];第七次城市道路与交通工程学术会议论文集[C];2002年
8 严力蛟;全为民;赵晓慧;;千岛湖浮游植物统计模型及其预测[A];浙江省第二届生物多样性保护与可持续发展研讨会论文摘要集[C];2004年
9 黄勃;刘瑞玉;;胶州湾非生物环境因子统计分析[A];动物学专辑——上海市动物学会1997年年会论文集[C];1997年
10 杨雪艳;董礼仁;周宪明;高锋;;长春市火险等级预报的统计模型研究[A];大气科学发展战略——中国气象学会第25次全国会员代表大会暨学术年会论文集[C];2002年
中国重要报纸全文数据库 前10条
1 李传金;设计新的统计模型[N];经济视点报;2006年
2 葛新权 北京信息科技大学经济管理学院;经济统计模型的建模原则与创新[N];中国社会科学报;2010年
3 于洋;统计模型参数估计及其应用成功[N];科技日报;2007年
4 钟君君;高盛:“买房算投资”低估了中国的消费水平[N];第一财经日报;2006年
5 李敏;“模型黄土高原”建设取得长足进展[N];黄河报;2007年
6 孟传良;略谈汉外词典的修订[N];中国图书商报;2005年
7 中国国际期货 张立军吕圳 郭良周;糖价特立独行 压力重重难上涨[N];期货日报;2007年
8 唐国储;法兴银行欺诈案对中国银行业改革的启示[N];金融时报;2008年
9 韩际平;不断地追求卓越[N];中国信息报;2008年
10 长软国际科技(北京)有限公司 华桦 刘会治 ;量化个人信用程度[N];中国计算机报;2005年
中国博士学位论文全文数据库 前10条
1 赵必强;中低纬电离层年度异常与暴时特性研究[D];中国科学院研究生院(武汉物理与数学研究所);2006年
2 孙俊;流媒体编码和传输中若干关键技术的研究[D];中国科学院研究生院(计算技术研究所);2006年
3 崔艳秋;基于小波域统计模型的图像去噪算法研究[D];吉林大学;2006年
4 李智录;大坝安全监控统计模型研究[D];西安理工大学;2006年
5 李卫华;数字图像预处理与融合方法研究[D];西北工业大学;2006年
6 练秋生;基于视觉特性的多方向小波构造及其应用研究[D];燕山大学;2006年
7 杨震;文本分类和聚类中若干问题的研究[D];北京邮电大学;2007年
8 龙建辉;高速远程黄土滑坡预测预报方法研究[D];长安大学;2008年
9 李士斌;深井岩石破碎规律及破碎的分形机理研究[D];大庆石油大学;2006年
10 侯建华;基于小波及其统计特性的图像去噪方法研究[D];华中科技大学;2007年
中国硕士学位论文全文数据库 前10条
1 钱揖丽;中文文本分词及词性标注自动校对方法研究[D];山西大学;2003年
2 张磊;基于最大熵模型的汉语词性标注研究[D];大连理工大学;2008年
3 刘金宁;词性标注体系对中文分词的影响[D];大连理工大学;2010年
4 刘东旭;在自然汉语中进行分词和词性标注[D];电子科技大学;2003年
5 张虎;汉语语料库词性标注一致性检查及自动校对方法研究[D];山西大学;2005年
6 熊冬明;汉语自动分词和中文人名识别技术研究[D];浙江大学;2006年
7 樊立三;现代汉语语文辞书词性标注研究[D];鲁东大学;2006年
8 孔海霞;基于最大熵的汉语词性标注[D];大连理工大学;2007年
9 张卫;中文词性标注的研究与实现[D];南京师范大学;2007年
10 杨金仑;云龙水库大坝安全监测数据分析方法研究[D];昆明理工大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026