收藏本站
《江西省语言学会第五届会员大会暨2002年学术年会论文集》2002年
收藏 | 手机打开
二维码
手机客户端打开本文

机器词典中按韵分词及虚词问题

傅思泉  
【摘要】:正一、关于按韵分词的认识问题目前机器分词的主要倾向是能按韵分词的时候按韵分词(胡明扬2003,进明1997、孙茂松1999),以符合人们的语感,如果按韵分词出现不一致的情况,有两种方法:一是结合语法规则考虑;二是根据大规模语料库,计算它的频率,如果达到一定的值,则为分词单位。
【分类号】:H085.5

手机知网App
【参考文献】
中国期刊全文数据库 前1条
1 冯胜利;论汉语“词”的多维性[J];当代语言学;2001年03期
【共引文献】
中国期刊全文数据库 前10条
1 彭泽润;林思佳;;从两个国家标准看汉语的词[J];北华大学学报(社会科学版);2006年06期
2 张健军;完句范畴的归纳及理据[J];边疆经济与文化;2005年09期
3 郝荣斋;;编辑语言文字加工的四个基本原则[J];中国编辑;2006年01期
4 文庭孝;汉语自动分词研究进展[J];图书与情报;2005年05期
5 王忠水;;跨文化交际教育中的文化冲突的超越[J];中共成都市委党校学报(哲学社会科学);2006年03期
6 黎良军;;词性标注与异层同形单位的处理[J];辞书研究;2007年04期
7 孔秀祥;语感在语义研究中的作用[J];楚雄师范学院学报;2002年04期
8 黄昌宁,孙茂松;中文信息处理最新成果的检阅——记新加坡中文电脑国际会议ICCC’96[J];国外语言学;1996年04期
9 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
10 石锋;王萍;;北京话单字音声调的分组统计分析[J];当代语言学;2006年04期
中国重要会议论文全文数据库 前10条
1 潘雪莲;;词频统计在词典收词中的作用[A];中国辞书论集2001[C];2001年
2 王慧慧;杨国纬;;基于事例的问答系统研究[A];贵州制约逻辑学会2005年学术年会暨首届全国性逻辑系统专题研讨会论文集[C];2005年
3 安娜;刘海涛;侯敏;;语料库中熟语的标记问题[A];第三届全国语言文字应用学术研讨会论文集[C];2004年
4 张宝林;崔希亮;任杰;;关于“HSK动态作文语料库”的建设构想[A];第三届全国语言文字应用学术研讨会论文集[C];2004年
5 李玉梅;靳光瑾;黄昌宁;;中文分词规范中的歧义字段消解细则[A];第五届全国语言文字应用学术研讨会论文集[C];2007年
6 李斌;;中文单字国名简称的自动识别[A];第二届全国学生计算语言学研讨会论文集[C];2004年
7 杨尔弘;方莹;乔羽;;汉语自动分词和词性标注评测[A];第二届全国学生计算语言学研讨会论文集[C];2004年
8 黄昌宁;林娟;孙承杰;;何谓金本位[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
9 侯敏;陈琼璜;初田天;李湛;王瑜;叶立;;汉语自动分词中的上下文相关歧义字段(CSAS)研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
10 卢俊之;;基于机器学习的分词不一致自动识别研究[A];第三届学生计算语言学研讨会论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 宣恒大;现代汉语隐现句研究[D];安徽大学;2011年
2 王迈;语言形式化原理[D];上海外国语大学;2011年
3 黄水清;非相关文献知识发现方法及在农业经济学中的应用[D];南京农业大学;2010年
4 李晋霞;现代汉语定中“V双+N双”结构研究[D];中国社会科学院研究生院;2002年
5 何婷婷;语料库研究[D];华中师范大学;2003年
6 彭宗平;北京话儿化词研究[D];北京语言大学;2004年
7 李良炎;基于词联接的自然语言处理技术及其应用研究[D];重庆大学;2004年
8 刘华;基于关键短语的文本内容标引研究[D];北京语言大学;2005年
9 达胡白乙拉;蒙古语基本动词短语自动识别研究[D];内蒙古大学;2005年
10 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
中国硕士学位论文全文数据库 前10条
1 王荔;统计全切分中文分词系统的研究与实现[D];西安电子科技大学;2009年
2 曾一平;中文文本情感分类的研究[D];北京交通大学;2011年
3 魏莎莎;一种中文未登录词识别及词典设计新方法[D];西南大学;2011年
4 姚亿兵;离合词离合形式的调查统计及其应用分析[D];曲阜师范大学;2011年
5 韩钰;中高级水平留学生汉语作文中的韵律偏误分析[D];华东师范大学;2011年
6 李畅;智能问答系统在高中物理教学中的应用[D];陕西师范大学;2011年
7 代媛;现代汉语词典编纂中的离合词问题[D];四川外语学院;2011年
8 蔡雯婷;现代汉语“V以”研究及其个案分析[D];上海师范大学;2011年
9 柳景珠(Lew KyungJu);现代汉语动宾式离合词在韩国语的对应表达研究[D];中央民族大学;2011年
10 张黎黎;现代汉语离合字组研究[D];湖北师范学院;2011年
【相似文献】
中国期刊全文数据库 前10条
1 杨成凯;关于汉语分词问题之我见[J];语言文字应用;1997年03期
2 宋柔;关于分词规范的探讨[J];语言文字应用;1997年03期
3 林杏光;我国的词典编纂事业述略[J];语言教学与研究;1998年02期
4 揭春雨;正词法和分词规范[J];语文建设;1990年04期
5 李生,赵铁军;机器词典的信息表示及在汉英机器翻译中的实现[J];中文信息学报;1994年01期
6 刘群耀;多了点语法规则 少了点艺术规则——读《语法错乱》一文[J];阅读与写作;1995年07期
7 孙茂松,邹嘉彦;汉语自动分词研究中的苦干理论问题[J];语言文字应用;1995年04期
8 彭泽润;林思佳;;从两个国家标准看汉语的词[J];北华大学学报(社会科学版);2006年06期
9 通拉嘎;赵小兵;;汉语分词规范对《信息处理用现代蒙古语切分规范》建立的启示[J];广西社会科学;2011年10期
10 揭春雨;“信息处理用现代汉语分词规范”的若干问题探讨[J];中文信息学报;1989年04期
中国重要会议论文全文数据库 前10条
1 傅思泉;;机器词典中按韵分词及虚词问题[A];江西省语言学会第五届会员大会暨2002年学术年会论文集[C];2002年
2 陈鄞;赵铁军;吕雅娟;于浩;;汉英机器翻译中数词的识别和翻译[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
3 张霄军;董宇;陈小荷;;基于语料考察的“组合型歧义”与“切分变异”辨析[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
4 高山;张艳;徐波;宗成庆;韩兆兵;;基于三元统计模型的汉语分词及标注一体化研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
5 李晶;陈鄞;杨沐昀;徐冰;;关于在分词系统中引入领域词典的研究[A];第二届全国学生计算语言学研讨会论文集[C];2004年
6 钱揖丽;张虎;;汉语分词及词性标注自动校验方法研究[A];第一届学生计算语言学研讨会论文集[C];2002年
7 于传武;李生;陈鄞;赵铁军;;基于混合策略的汉语未登录词整体识别[A];第一届学生计算语言学研讨会论文集[C];2002年
8 陈群秀;;现代汉语实词词汇语义知识的研究和实现[A];第六届汉语词汇语义学研讨会论文集[C];2005年
9 李玉梅;陈晓;姜自霞;靳光瑾;易江燕;黄昌宁;;分词规范亟需补充的三方面内容[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
10 李娜;;从语法与修辞关系的角度看现代汉语中“副+名”现象[A];2007年福建省辞书学会第18届年会论文提要集[C];2007年
中国重要报纸全文数据库 前9条
1 记者 潘治;人脑存在“普遍语法”[N];新华每日电讯;2003年
2 沈锡伦;语言中的类推现象[N];语言文字周报;2007年
3 江建国;会不会出现“欧洲语”(五洲茶亭)[N];人民日报;2002年
4 卓娜 黄静;西藏藏语文工作委员会来州考察[N];阿坝日报;2006年
5 邢晔;有了谷歌“统计式翻译”,翻译人员会不会下岗?[N];新华每日电讯;2007年
6 马莉;少数民族学生学汉语难在哪[N];伊犁日报(汉);2007年
7 刘宏章;“阿拉善”蒙文读音及书写规范统一为“alaxia”[N];内蒙古日报(汉);2008年
8 中央民族大学少数民族语言文学系 钟进文 卓小清;新时期高校民族语课程设置的几点思考[N];中国民族报;2009年
9 王毓先;押韵与词语的交互换位使用[N];太行日报;2010年
中国博士学位论文全文数据库 前1条
1 王斯日古楞;基于混合策略的汉蒙机器翻译及相关技术研究[D];内蒙古大学;2009年
中国硕士学位论文全文数据库 前10条
1 任道;语言规则及其掌握的合理途径[D];东北师范大学;2007年
2 刘晶;语法学习中的频次效应与注意力资源的利用[D];山西师范大学;2012年
3 范颖睿;现代汉语“词语非常规组合式”的和谐义素理论的提出及应用[D];内蒙古师范大学;2007年
4 夏国强;“文例”之研究[D];新疆师范大学;2007年
5 张颖;对外汉语知识型语法课教学策略研究[D];北京语言大学;2007年
6 钱春玲;《外国人实用汉语语法(修订本)》句法部分的实用性研究[D];吉林大学;2010年
7 回海滨;“被XX”结构研究[D];辽宁师范大学;2011年
8 李洁;对《围城》中语码转换的分析[D];东华大学;2005年
9 沈红红;留学生“住”作结果补语的习得研究[D];北京语言大学;2006年
10 吴英信;韩国人学习汉语语法偏误分析[D];西北大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026