收藏本站
《第三届全国语言文字应用学术研讨会论文集》2004年
收藏 | 手机打开
二维码
手机客户端打开本文

语料库中熟语的标记问题

安娜  刘海涛  侯敏  
【摘要】:正一引言在建设传媒语言语料库的过程中,我们根据对语料库加工的通行做法,先对原始语料作词性标注。词性标注之后,当我们开始进行句法层次的加工时,发现目前的熟语标记存在一定的问题。我们在对生语料做词性标注时,采用的是北京大学计算语言

手机知网App
【参考文献】
中国期刊全文数据库 前1条
1 孙茂松,邹嘉彦;汉语自动分词研究中的苦干理论问题[J];语言文字应用;1995年04期
【共引文献】
中国期刊全文数据库 前10条
1 文庭孝;汉语自动分词研究进展[J];图书与情报;2005年05期
2 黄诞平;;语料库与翻译研究及翻译教学[J];重庆职业技术学院学报;2006年03期
3 黄昌宁,孙茂松;中文信息处理最新成果的检阅——记新加坡中文电脑国际会议ICCC’96[J];当代语言学;1996年04期
4 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
5 刘禹孜,何中市;一种基于SVM和规则消除组合型歧义的算法[J];重庆大学学报(自然科学版);2005年10期
6 于亭;计算机与古籍整理研究手段现代化[J];古汉语研究;2000年03期
7 李睿;基于语料库的对比分析和差错分析在英语教学中的价值[J];甘肃高师学报;2005年03期
8 刘晓英;汉语自动分词研究的发展趋势[J];高校图书馆工作;2005年04期
9 张素娟,郑庆华,胡云华,孙霞;一种面向网络答疑的汉语切分歧义消除算法[J];计算机工程与应用;2004年25期
10 刘迁;贾惠波;;中文信息处理中自动分词技术的研究与展望[J];计算机工程与应用;2006年03期
中国重要会议论文全文数据库 前10条
1 潘雪莲;;词频统计在词典收词中的作用[A];中国辞书论集2001[C];2001年
2 孟繁杰;;试析惯用语的典型性与非典型性[A];第六届汉语词汇语义学研讨会论文集[C];2005年
3 傅思泉;;机器词典中按韵分词及虚词问题[A];江西省语言学会第五届会员大会暨2002年学术年会论文集[C];2002年
4 孙茂松;;汉语自动分词研究的若干最新进展——清华大学相关工作简介[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
5 李斌;;中文单字国名简称的自动识别[A];第二届全国学生计算语言学研讨会论文集[C];2004年
6 杨翠兰;;基于语料统计的汉语成语语法功能研究[A];第二届全国学生计算语言学研讨会论文集[C];2004年
7 宝金良;;蒙古文文本标点符号及其属性字段设置[A];第十届全国少数民族语言文字信息处理学术研讨会论文集[C];2005年
8 郭慧志;刘华;谢学敏;张普;;《人民日报》标注语料的初步统计分析[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
9 邹煜;胡凤国;;传媒语音语料库的语料选取和标注[A];第八届全国人机语音通讯学术会议论文集[C];2005年
10 王波;王厚峰;;中文单词聚类的比较研究[A];第三届学生计算语言学研讨会论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 梁敬美;“这-”、“那-”的语用与话语功能研究[D];中国社会科学院研究生院;2002年
2 何婷婷;语料库研究[D];华中师范大学;2003年
3 熊子瑜;自然语句边界的韵律特征及其交际功能[D];中国社会科学院研究生院;2003年
4 刘华;基于关键短语的文本内容标引研究[D];北京语言大学;2005年
5 达胡白乙拉;蒙古语基本动词短语自动识别研究[D];内蒙古大学;2005年
6 王智强;汉语指代消解及相关技术研究[D];北京邮电大学;2006年
7 徐艳华;现代汉语实词语法功能考察及词类体系重构[D];南京师范大学;2006年
8 张春霞;领域文本知识获取方法研究及其在考古领域中的应用[D];中国科学院研究生院(计算技术研究所);2005年
9 程勇;基于本体的不确定性知识管理研究[D];中国科学院研究生院(计算技术研究所);2005年
10 Maharani(陈玉兰);汉语、印尼语动词重叠对比研究[D];上海师范大学;2007年
中国硕士学位论文全文数据库 前10条
1 尤浩杰;非汉字文化圈学习者掌握汉字情况分析[D];北京语言文化大学;2001年
2 马东坡;Internet中文智能搜索引擎汉语自动分词系统设计[D];广西师范大学;2002年
3 许林杰;中文文本分词研究[D];山东师范大学;2003年
4 王丁;基于中文文本分类的自动诊病系统[D];哈尔滨理工大学;2003年
5 梁春丽;论文学翻译中译者的主体意识[D];广西师范大学;2003年
6 朱珣;中文自动分词系统的研究[D];华中师范大学;2004年
7 丁建川;汉语典故词语研究[D];曲阜师范大学;2004年
8 陈诚;论古典文献数字化[D];苏州大学;2004年
9 王志勇;基于统计语言学模型的中文文本信息检索[D];第二军医大学;2004年
10 赵志靖;汉语自动分词技术及其在机器人辅助教育智能接口中的应用研究[D];天津师范大学;2004年
【相似文献】
中国期刊全文数据库 前10条
1 ;“2011中国语料库语言学大会”征文通知[J];疯狂英语(教师版);2011年03期
2 ;2011中国语料库语言学大会[J];英语教师;2011年08期
3 本刊记者;;“2011中国语料库语言学大会”将在北京举行[J];语言科学;2011年04期
4 俞丽芳;吴秀兰;康一清;;语料库在大学英语写作中的应用研究[J];大家;2011年16期
5 张正波;;语料库语言学在教学中的应用[J];文学教育(中);2011年07期
6 许有平;周霜;;语料库在英语课堂教学中的应用[J];大众文艺;2011年16期
7 李征娅;;语料库语言学在外语教学中的应用[J];陕西教育(高教版);2011年05期
8 田原;王东;;语料库语言学对语言学理论的贡献分析[J];作家;2011年16期
9 李淼;;关于建设历代汉语俗语词辞书语料库的初步构想[J];文化学刊;2011年04期
10 盛玉麒;;“汉语语料库及语料库语言学圆桌会议”在香港召开[J];当代语言学;2011年03期
中国重要会议论文全文数据库 前10条
1 安娜;刘海涛;侯敏;;语料库中熟语的标记问题[A];第三届全国语言文字应用学术研讨会论文集[C];2004年
2 赵大明;;关于《现代汉语规范字典》的词性标注[A];中国辞书论集1999[C];1999年
3 邢富坤;宋柔;;自动词性标注中语法因素和词汇因素对英汉语的不同影响[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 帕里旦·吐尔逊;艾山·吾买尔;吐尔根·依布拉音;早克热·卡德尔;阿力木江·艾沙;;基于最大熵的维吾尔语词性标注模型[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
5 钱揖丽;张虎;;汉语分词及词性标注自动校验方法研究[A];第一届学生计算语言学研讨会论文集[C];2002年
6 通拉嘎;;汉、蒙、藏、维分词与词性标注技术发展现状研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
7 艳红;王斯日古楞;;蒙古文词语切分在自动词性标注中的应用[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
8 牛洪梅;吐尔根.伊不拉音;;维吾尔语的词性标注校对初探[A];第三届学生计算语言学研讨会论文集[C];2006年
9 林红;胡欣;;最大熵模型的应用[A];新世纪气象科技创新与大气科学发展——中国气象学会2003年年会“地球气候和环境系统的探测与研究”分会论文集[C];2003年
10 梁红梅;尹晓霞;李宇庄;叶邵宁;;语料库驱动下的外语在线自主学习模式[A];教育技术应用与整合研究论文[C];2005年
中国重要报纸全文数据库 前10条
1 许家金 北京外国语大学中国外语教育研究中心;语料库语言学研究[N];中国社会科学报;2011年
2 顾曰国;语料库语言学的发展[N];中国社会科学院院报;2003年
3 孟传良;略谈汉外词典的修订[N];中国图书商报;2005年
4 任笑元;全球消费电子顶级展会有望落户中国[N];国际商报;2004年
5 北京大学中文系 陆俭明;要对广大读者负责[N];中国社会科学院院报;2004年
6 王小宁;辞书应慎用“规范”冠名[N];人民政协报;2004年
7 语言所 董琨;错误百出 贻笑大方[N];中国社会科学院院报;2004年
8 教育部语言文字信息管理司司长李宇明;语言文字工作应当与时俱进[N];中国教育报;2001年
9 ;语言信息处理呼唤知识应用[N];中国计算机报;2003年
10 杨永林;双语标志译写规范[N];中华读书报;2011年
中国博士学位论文全文数据库 前10条
1 孙毅;隐喻机制的劝谏性功能[D];上海外国语大学;2009年
2 陈浪;当代语言学途径翻译研究的新进展[D];上海外国语大学;2008年
3 郭永辉;英汉机器翻译系统关键技术研究[D];解放军信息工程大学;2006年
4 姜维;统计中文词法分析及其强化学习机制的研究[D];哈尔滨工业大学;2007年
5 曹海龙;基于词汇化统计模型的汉语句法分析研究[D];哈尔滨工业大学;2006年
6 孙晓;中文词法分析的研究及其应用[D];大连理工大学;2010年
7 刘兴林;中文词汇知识获取算法和语义计算研究及应用[D];华南理工大学;2012年
8 朱聪慧;汉英动词次范畴相关技术的研究[D];哈尔滨工业大学;2009年
9 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
10 李晓黎;WEB信息检索与分类中的数据采掘研究[D];中国科学院研究生院(计算技术研究所);2001年
中国硕士学位论文全文数据库 前10条
1 钱揖丽;中文文本分词及词性标注自动校对方法研究[D];山西大学;2003年
2 刘金宁;词性标注体系对中文分词的影响[D];大连理工大学;2010年
3 黄勇杰;基于统计NLP技术的甲骨卜辞的分析研究[D];华东师范大学;2010年
4 刘东旭;在自然汉语中进行分词和词性标注[D];电子科技大学;2003年
5 张虎;汉语语料库词性标注一致性检查及自动校对方法研究[D];山西大学;2005年
6 张磊;基于最大熵模型的汉语词性标注研究[D];大连理工大学;2008年
7 熊冬明;汉语自动分词和中文人名识别技术研究[D];浙江大学;2006年
8 樊立三;现代汉语语文辞书词性标注研究[D];鲁东大学;2006年
9 孔海霞;基于最大熵的汉语词性标注[D];大连理工大学;2007年
10 张卫;中文词性标注的研究与实现[D];南京师范大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026