收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

解决汉语自动分词的方法选择

曲维光  
【摘要】:本文分析了目前解决汉语自动分词问题的主流方法,如概率方法和机械匹配方法,指出它们存在的方法论的缺陷,虽然目前可以达到很高的识别率,但无法从根本上解决分词问题。通过对智能型方法的讨论,分析了基于专家系统方法和基于人工神经网络方法各自的优点和需要改进的问题以及解决思路,提出用文本挖掘的方法从大规模语料库中提取专家系统的规则,用概率方法提高处理速度,用神经网络,通过使用高层次语言知识来处理歧义切分,用机器学习方法来处理未登录词。今后的工作中将在该模型的指导下进行系统实现,以期达到预期的效果

知网文化
【相似文献】
中国重要会议论文全文数据库 前10条
1 曲维光;;解决汉语自动分词的方法选择[A];第一届学生计算语言学研讨会论文集[C];2002年
2 贺前华;徐秉铮;;神经网络在汉语自动分词中的应用[A];第二届全国人机语音通讯学术会议论文集[C];1992年
3 孙茂松;;汉语自动分词研究及其应用:回顾与展望[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
4 侯敏;陈琼璜;初田天;李湛;王瑜;叶立;;汉语自动分词中的上下文相关歧义字段(CSAS)研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
5 孙茂松;;汉语自动分词研究的若干最新进展——清华大学相关工作简介[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
6 肖航;靳光瑾;;现代汉语词语切分歧义库构建[A];第三届全国语言文字应用学术研讨会论文集[C];2004年
7 朱晓旭;;汉字输入教学系统中词组切分方法的设计[A];中国中文信息学会汉字编码专业委员会第八届年会、中国计算机学会中文信息技术专业委员会第六届年会暨汉字输入技术与应用研讨会论文集[C];2002年
8 陈晓;;中文文本自动分词研究述要[A];第四届全国语言文字应用学术研讨会论文集[C];2005年
9 杨尔弘;方莹;乔羽;;汉语自动分词和词性标注评测[A];第二届全国学生计算语言学研讨会论文集[C];2004年
10 庄丽;包塔;朱小燕;;盲人用计算机软件系统中的语音和自然语言处理技术[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
中国博士学位论文全文数据库 前2条
1 贺前华;汉语自动分词及机器翻译研究[D];华南理工大学;1993年
2 王立欣;翻译标准自动量化方法研究[D];上海外国语大学;2007年
中国硕士学位论文全文数据库 前10条
1 罗小虎;基于蚁群算法的汉语自动分词的研究与实现[D];苏州大学;2004年
2 李丹;基于规则与统计的汉语自动分词研究[D];长春工业大学;2010年
3 潘景剑;具有中文人名识别功能的汉语自动分词算法研究[D];河北工业大学;2006年
4 杨超;基于最大匹配的书面汉语自动分词研究[D];湖南大学;2004年
5 张淑梅;词典与后缀数组相结合的中文分词[D];吉林大学;2006年
6 黄立冬;基础教育资源搜索引擎中的中文分词技术研究[D];南京师范大学;2006年
7 王广正;基于知网语义相关度计算的汉语自动分词方法的研究[D];云南师范大学;2006年
8 刘武;基于统计机器学习算法的汉语分词系统的研究[D];北京邮电大学;2006年
9 程晓静;自然语言处理在药物专利检索系统中的应用[D];大连理工大学;2004年
10 吴虹;基于本体与模糊数学的自动分词系统研究[D];北京理工大学;2008年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978