收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于马尔可夫间隔标注的中文分词算法

姜文斌  王志洋  刘群  吕雅娟  
【摘要】:典型的判别式方法通过标注每个字符在词中的相对位置,将分词看作字符标注问题。本文提出了一个形式化的标注策略——马尔可夫间隔标注,来对汉语进行分词。在每一步中,N阶马尔可夫间隔标注对连续的N+1个字符间隔进行标注,并按照马尔可夫方式来处理这N+1个间隔。实验结果表明:在使用相似特征的前提下,当阶数由0渐变为2时,间隔标注方法的分词准确率也随之增加。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张晨;祁坤钰;;基于Penn Treebank英语标注集对《圣经》标注集的扩充研究[J];才智;2009年20期
2 阿里甫·库尔班;吾买尔江·库尔班;吐尔根·伊布拉音;;信息处理维吾尔语词语分类体系及标记研究(Ⅰ)[J];新疆大学学报(自然科学版);2009年04期
3 苏祺,昝红英,胡景贺,项锟;词性标注对信息检索系统性能的影响[J];中文信息学报;2005年02期
4 鲁强;金伟祖;;基于FMM和CRFs双层分词模型的研究[J];电脑知识与技术;2008年28期
5 张开旭;夏云庆;宇航;;基于条件随机场的古汉语自动断句与标点方法[J];清华大学学报(自然科学版);2009年10期
6 张开旭;夏云庆;宇航;;基于条件随机场的古文自动断句与标点方法[J];清华大学学报(自然科学版)网络.预览;2009年10期
7 王凡秀;;基于条件随机场的中文地名识别[J];中国西部科技;2008年28期
8 赵海;揭春雨;;基于有效子串标注的中文分词[J];中文信息学报;2007年05期
9 李志圣;孙越恒;何丕廉;侯越先;;基于k-means和半监督机制的单类中心学习算法[J];计算机应用;2008年10期
10 吴毓龙;袁平波;;密度敏感的距离测度在特定图像聚类中的应用[J];计算机工程;2009年06期
11 刘克强;;2009共享版ICTCLAS的分析与使用[J];科教文汇(上旬刊);2009年08期
12 周可艳;宗成庆;;对话行为信息在口语翻译中的应用[J];中文信息学报;2010年06期
13 虎晓红;钱旭;王晓磊;;图像语义标注中的叙词查询方法[J];计算机应用研究;2011年08期
14 虎晓红;钱旭;兰洋;;基于Vague融合的自动图像标注方法[J];郑州大学学报(理学版);2010年01期
15 黄德根;焦世斗;周惠巍;;基于子词的双层CRFs中文分词[J];计算机研究与发展;2010年05期
16 宋彦;李厚强;戴礼荣;唐金辉;华先胜;;一种基于多互补分类器的自动视频语义标注方法[J];小型微型计算机系统;2007年11期
17 刘智文;;利用系统整合提高中文分词精度的方法研究[J];现代计算机(专业版);2009年10期
18 蒋文明;张雪英;李伯秋;;基于条件随机场的中文地址要素识别方法[J];计算机工程与应用;2010年13期
19 尤昉,李涓子,王作英;基于语义依存关系的汉语语料库的构建[J];中文信息学报;2003年01期
20 孙晓鹏;张琪;魏小鹏;;半监督的三维网格模型层次分割[J];计算机辅助设计与图形学学报;2010年04期
中国重要会议论文全文数据库 前10条
1 苏祺;昝红英;胡景贺;项锟;;词性标注对信息检索系统性能的影响[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
2 黄昌宁;赵海;;由字构词——中文分词新方法[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
3 徐琳宏;林鸿飞;;文本情感语料库的构建和分析[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
4 曾涛;向勇;包小源;刘胤田;蒋永光;;中医古方挖掘:一种频繁药组发现与功效标注算法[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
5 姜文斌;王志洋;刘群;吕雅娟;;基于马尔可夫间隔标注的中文分词算法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
6 王东波;陈小荷;年洪东;;基于条件随机场的有标记联合结构自动识别[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
7 王智强;刘海静;李双红;李茹;;基于TCRF的核心框架元素标注[A];第五届全国青年计算语言学研讨会论文集[C];2010年
8 张颖杰;李斌;陈家骏;陈小荷;;基于词典的半指导学习古汉语全文词义标注[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
9 张苇如;孙乐;韩先培;;基于维基百科和模式聚类的实体关系抽取方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
10 曲维光;;语料自动校对中一致性问题的处理[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
中国博士学位论文全文数据库 前10条
1 刘凯鹏;社会性标注关键技术及其在信息检索中的应用研究[D];哈尔滨工业大学;2010年
2 王科平;自动图像标注的关键技术研究[D];北京邮电大学;2011年
3 戴礼灿;大数据检索及其在图像标注与重构中的应用[D];中国科学技术大学;2013年
4 夏丁胤;互联网图像高效标注和解译的关键技术研究[D];浙江大学;2010年
5 王丽苹;融合领域知识的心电图分类方法研究[D];华东师范大学;2013年
6 赵玉凤;图像检索中自动标注技术的研究[D];北京交通大学;2009年
7 刘峥;图像的语义标注及其改善问题研究[D];山东大学;2011年
8 侯锋;中文报业出版的文字质量智能辅助控制技术研究[D];国防科学技术大学;2010年
9 王萍;网络环境下的领域知识挖掘[D];华东师范大学;2010年
10 钱伟中;基于判别式模型的蛋白质互作用文本挖掘技术研究[D];电子科技大学;2011年
中国硕士学位论文全文数据库 前10条
1 何斯琼;基于稀疏回归模型的图像标注研究[D];浙江大学;2010年
2 夏静;基于社会标注的主题分类及排序优化方法研究[D];华中科技大学;2011年
3 曹月;融合视觉与语义双模态信息的自动图像标注[D];北京理工大学;2010年
4 王前程;自动图像标注中基于局部泛化误差模型的特征权重研究[D];华南理工大学;2011年
5 周云;社会化媒体下的图像标注补充研究[D];合肥工业大学;2013年
6 胡微微;基于语义分析的图像多标签标注算法研究[D];华东理工大学;2013年
7 曾冠明;基于条件随机场的中文命名实体识别研究[D];北京邮电大学;2009年
8 张志楠;语音Corpus的自动构建和语音最小化标注的研究[D];中国海洋大学;2013年
9 魏云超;融合颜色词描述的自动图像标注算法研究与实现[D];北京交通大学;2011年
10 音学;基于Semi-CCA的自动图像标注研究[D];安徽大学;2011年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978