收藏本站
《语言文字应用研究论文集(Ⅱ)》2004年
收藏 | 手机打开
二维码
手机客户端打开本文

确定切词单位的某些非语法因素

冯志伟  
【摘要】:正在汉语书面文本的自动切分中,切分单位的确定是一个关键而困难的问题。之所以说这是“关键”问题,是因为如果切分单位不合理,将严重影响自动切分的效果和应用的前景;之所以说这是“困难”问题,是因为切分单位的确定常常令研究人员举棋不定,无所适从,分词规范中提出的“结合紧密,使用稳定”的原则,显得过于笼统和含混,难于操作。我们认为,导致这种困境的根源在于语言学中对于“词”的定义。在语言学理论上,把词定义为“语言中能够自由运用的最小单位”,这样定义的词,我们把它叫做“理论词”(theoretical word)。这样定义的理论词,在理论上存在着相互矛盾、不能自圆其说的严重缺陷,使得语素、词和词组的界限划水难分。
【分类号】:H146.3

手机知网App
【共引文献】
中国期刊全文数据库 前10条
1 刘来旸,瞿有利,樊孝忠;汉语智能输入系统的设计[J];北京理工大学学报;2001年03期
2 亢世勇;《现代汉语新词语信息(电子)词典》的开发与应用[J];辞书研究;2001年02期
3 亢世勇;《现代汉语语法信息词典》的特点与不足[J];辞书研究;2001年06期
4 王小海;关于计算词典学[J];辞书研究;2003年05期
5 王祁,邹冰;现行英汉机器翻译系统存在的问题及解决策略[J];东北大学学报(社会科学版);2003年05期
6 徐延勇,周献中,井祥鹤,郭忠伟;基于最大熵模型的汉语句子分析[J];电子学报;2003年11期
7 李良炎,何中市,易勇;基于词联接的语义表示方法和知识库建设[J];重庆大学学报(自然科学版);2004年04期
8 李良炎,何中市,易勇;基于词联接的语义分析原理及其算法[J];重庆大学学报(自然科学版);2004年08期
9 段绮丽;机器翻译中词义的常识排歧[J];重庆大学学报(自然科学版);2005年03期
10 徐志明,王晓龙,姜守旭;一种语句级汉字输入技术的研究[J];高技术通讯;2000年01期
中国重要会议论文全文数据库 前10条
1 Yu Junping;英汉双语词典在大学英语课堂教学中的应用(英文)[A];亚洲辞书学会第一届年会论文集[C];1999年
2 王惠;苏新春;;XHK基于语法知识的汉语词义描述[A];第六届汉语词汇语义学研讨会论文集[C];2005年
3 张俊萍;冯志伟;;CTT在汉语语法研究和教学中的应用[A];第六届汉语词汇语义学研讨会论文集[C];2005年
4 朱学锋;俞士汶;李峰;;汉语语素库的构造及其同语法信息词典的集成[A];世纪之交的中国应用语言学研究——第二届全国语言文字应用学术研讨会论文集[C];1998年
5 李竹;;中文信息处理与现代汉语词类研究[A];世纪之交的中国应用语言学研究——第二届全国语言文字应用学术研讨会论文集[C];1998年
6 李晋霞;;面向计算机的“V_双+N_双”结构类型研究[A];语言文字应用研究论文集(Ⅱ)[C];2004年
7 郑定欧;;汉语动词词汇语法[A];语言文字应用研究论文集(Ⅱ)[C];2004年
8 邢红兵;;面向对外汉语教学的动词用法频率词典[A];对外汉语学习词典学国际研讨会论文集[C];2005年
9 才让加;吉太加;;藏语语料库中词性分类代码的确定[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
10 金东日;;在朝汉机器翻译上出现转换的难点[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 肖明;WWW科技信息资源自动标引的理论与实践研究[D];中国科学院文献情报中心;2001年
2 齐璇;汉语语义知识的表示及其在汉英机译中的应用[D];国防科学技术大学;2002年
3 何婷婷;语料库研究[D];华中师范大学;2003年
4 马红妹;汉英机器翻译中汉语上下文语境的表示与应用研究[D];中国人民解放军国防科学技术大学;2002年
5 张蕾;概念结构及其应用[D];西北工业大学;2001年
6 樊中元;现代汉语一名多量现象研究[D];湖南师范大学;2003年
7 郭忠伟;作战文书自动生成理论及方法研究[D];南京理工大学;2003年
8 曲卫民;中文XML信息检索系统的研究[D];中国科学院研究生院(软件研究所);2004年
9 刁晏斌;虚义动词论[D];南开大学;2004年
10 陈清才;基于粗集的汉语建模及其应用研究[D];哈尔滨工业大学;2003年
中国硕士学位论文全文数据库 前10条
1 娄(王廷);现代汉语分词系统通用性设计及切分歧义处理[D];北京工业大学;2000年
2 朱彦;复合词的语义结构与词素义的提示机制[D];广西师范大学;2000年
3 李林;三种认知语言观与外语教学研究[D];陕西师范大学;2001年
4 韩习武;机器翻译中语义因素的理论分析[D];黑龙江大学;2001年
5 黄元萃;汉语基本名词短语的自动识别模型[D];大连理工大学;2001年
6 唐春英;英汉歧义现象对比研究[D];广西师范大学;2001年
7 黄艳;面向数字化产品的自然语言查询技术的研究与开发[D];浙江大学;2002年
8 罗智勇;现代汉语通用分词系统的技术与实现[D];北京工业大学;2002年
9 马长林;中文自动文摘技术若干问题的研究[D];华中师范大学;2002年
10 王春霞;基于语料库的离合词研究[D];北京语言文化大学;2001年
【相似文献】
中国期刊全文数据库 前10条
1 ;看点[J];学习博览;2011年09期
2 杨承淑;邓敏君;;老手与新手译员的口译决策过程[J];中国翻译;2011年04期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 冯志伟;;确定切词单位的某些非语法因素[A];语言文字应用研究论文集(Ⅱ)[C];2004年
2 邢红兵;;从分词的不一致性看汉语分词的难点[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
3 靳光瑾;肖航;富丽;;信息处理用现代汉语词类标记规范(修订)[A];第四届全国语言文字应用学术研讨会论文集[C];2005年
4 吕纯新;;实现医院信息管理 领导意识要跟上[A];新疆医学工程学会第一届学术年会论文汇编[C];1996年
5 ;江苏省老科协城市社区科普工作经验交流会纪要[A];中国老科协社区科普和老专家志愿者工作研讨会文集[C];2006年
6 邹春玲;;智力残疾评定254例及相关心理分析、心理治疗[A];中国心理卫生协会第五届学术研讨会论文集[C];2007年
7 颜永平;;属地化以来财务管理工作的实践与认识[A];资源·环境·和谐社会——中国地质矿产经济学会2007年学术年会论文集[C];2007年
8 李金旺;;煤矿企业内部市场化经营结算系统的开发与应用[A];煤炭经济管理新论(第9辑)——第十届中国煤炭经济管理论坛暨2009年中国煤炭学会经济管理专业委员会年会论文集[C];2009年
9 ;营养科室的行政管理[A];中国营养学会第十届临床营养学术会议论文汇编[C];2004年
10 申屠阳;;肺癌常用分期方法的应用和评价[A];第四届中国肿瘤学术大会暨第五届海峡两岸肿瘤学术会议论文集[C];2006年
中国重要报纸全文数据库 前10条
1 记者 李亚楠;郑州政府部门每月“网考”,低分单位需整改[N];新华每日电讯;2010年
2 记者 赵捷;管道局部分单位工作汇报会结束[N];石油管道报;2008年
3 ;我院任免部分单位干部[N];中国社会科学院院报;2004年
4 记者 景延安;听取机关部分单位主要负责人述职述廉[N];中国纪检监察报;2005年
5 记者 刘河山;州直单位包村支农工作遭遇两重天[N];昌吉日报;2008年
6 ;我院任免部分单位领导干部[N];中国社会科学院院报;2004年
7 车辉;对部分单位未放“五四”假尚无说法[N];工人日报;2008年
8 记者 刘怀英;部分单位对创卫重要性认识不足[N];广元日报;2006年
9 林旗 繁来 小兵 于静;我院部分单位举行庆祝建党83周年纪念活动[N];中国社会科学院院报;2004年
10 本报记者 王霞;廉风荡腐[N];中国纪检监察报;2004年
中国博士学位论文全文数据库 前1条
1 刘荣;面向教育领域的固定短语提取方法研究[D];北京语言大学;2009年
中国硕士学位论文全文数据库 前8条
1 刘芳;芦苇湿地对污水中氮磷的净化能力研究[D];河北农业大学;2004年
2 龙军;基于角色标注的中文POI名称匹配的研究及原型系统实现[D];西南大学;2008年
3 苏卫胜;SL行业事业单位岗位设置方案研究[D];华北电力大学(北京);2007年
4 米春;中国学生英语写作中的文化因素——思维模式在写作过程中的影响的研究[D];华中师范大学;2001年
5 屈军;基于GPRS的数据传输系统的研究[D];天津大学;2003年
6 李艳;我国书业信息标准化问题研究[D];武汉大学;2005年
7 邵将;节流管调控式阀门CAD模块开发及CAE应用技术研究[D];江南大学;2004年
8 董仲奎;面向文物的地理信息系统的建立[D];清华大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026