收藏本站
《第二届全国学生计算语言学研讨会论文集》2004年
收藏 | 手机打开
二维码
手机客户端打开本文

汉语自动分词和词性标注评测

杨尔弘  方莹  乔羽  
【摘要】:本文介绍了2003年“中文与接口技术”汉语自动分词与词性标注一体化评测的一些基本情况,主要包括评测的内容、评测方法、测试试题的选择产生、测试指标以及测试结果。并着重介绍了测试中所采用的一种柔性化的自动测试方法。同时,对评测的结果进行了一些分析,对今后的评测提出了一些建议。

手机知网App
【参考文献】
中国期刊全文数据库 前3条
1 孙茂松,左正平,邹嘉彦;高频最大交集型歧义切分字段在汉语自动分词中的作用[J];中文信息学报;1999年01期
2 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
3 何克抗,徐辉,孙波;书面汉语自动分词专家系统设计原理[J];中文信息学报;1991年02期
【共引文献】
中国期刊全文数据库 前10条
1 彭泽润;林思佳;;从两个国家标准看汉语的词[J];北华大学学报(社会科学版);2006年06期
2 龚汉明,周长胜;汉语分词技术综述[J];北京机械工业学院学报;2004年03期
3 马志强;周长胜;丁维;杨娜;;校园网搜索引擎的研究与实现[J];北京机械工业学院学报;2007年01期
4 汪涛,樊孝忠,顾益军,刘林;基于概念分析的主题爬虫设计[J];北京理工大学学报;2004年10期
5 文庭孝;汉语自动分词研究进展[J];图书与情报;2005年05期
6 陆俭明;;要重视特征的研究与描写[J];长江学术;2006年01期
7 吴登堂;关于字母词的思考——兼谈中文信息处理对字母词自动切分的构想[J];丹东师专学报;2003年02期
8 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
9 张利;张立勇;张晓淼;耿铁锁;岳宗阁;;基于改进BP网络的中文歧义字段分词方法研究[J];大连理工大学学报;2007年01期
10 吴静,蔡砥,王铮;地理信息系统中自然语言查询的分词处理与应用[J];地球信息科学;2005年03期
中国重要会议论文全文数据库 前10条
1 胡清平;;受控语言及其在汉英机器翻译里的应用前景[A];国际译联第四届亚洲翻译家论坛论文集[C];2005年
2 王慧慧;杨国纬;;基于事例的问答系统研究[A];贵州制约逻辑学会2005年学术年会暨首届全国性逻辑系统专题研讨会论文集[C];2005年
3 靳光瑾;郭曙纶;肖航;章云帆;;语料库加工中的规范问题——谈《信息处理用现代汉语词类标记集规范》[A];语言文字应用研究论文集(Ⅱ)[C];2004年
4 张宝林;崔希亮;任杰;;关于“HSK动态作文语料库”的建设构想[A];第三届全国语言文字应用学术研讨会论文集[C];2004年
5 陈晓;;中文文本自动分词研究述要[A];第四届全国语言文字应用学术研讨会论文集[C];2005年
6 傅思泉;;机器词典中按韵分词及虚词问题[A];江西省语言学会第五届会员大会暨2002年学术年会论文集[C];2002年
7 贺前华;徐秉铮;;神经网络在汉语自动分词中的应用[A];第二届全国人机语音通讯学术会议论文集[C];1992年
8 邹纲;刘洋;刘群;孟遥;于浩;西野文人;亢世勇;;面向Internet的中文新词语检测[A];2004年辞书与数字化研讨会论文集[C];2004年
9 侯敏;;汉语自动分析中的若干问题与对策[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
10 陶建华;蔡莲红;赵晟;;汉语语音合成中的文本分析和韵律处理[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
中国博士学位论文全文数据库 前10条
1 王强军;基于动态流通语料库(DCC)的信息技术领域新术语自动提取研究[D];北京语言文化大学;2003年
2 宋春阳;面向信息处理的现代汉语“名+名”逻辑语义研究[D];上海师范大学;2003年
3 张蕾;概念结构及其应用[D];西北工业大学;2001年
4 张伟;基于WWW的聚类引擎研究[D];重庆大学;2003年
5 隋岩;基于“动态流通语料库”的“有效字符串”提取研究[D];北京语言大学;2004年
6 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
7 李良炎;基于词联接的自然语言处理技术及其应用研究[D];重庆大学;2004年
8 代六玲;互联网内容监管系统关键技术的研究[D];南京理工大学;2005年
9 杨建国;基于动态流通语料库(DCC)的汉语熟语单位研究[D];北京语言大学;2005年
10 刘华;基于关键短语的文本内容标引研究[D];北京语言大学;2005年
中国硕士学位论文全文数据库 前10条
1 杨彦;基于Hash结构的机械统计分词系统[D];中南大学;2005年
2 葛强;亲属关系逻辑推理专家系统的研究[D];河南大学;2005年
3 付曙光;合作伙伴的Web挖掘系统研究[D];辽宁工程技术大学;2005年
4 颜伟;“不形”短语的自动识别方法和特征的大规模调查研究[D];北京语言大学;2005年
5 刘雪芹;单汉字全文检索技术研究[D];河北工业大学;2005年
6 朴点熙;七种汉语教材选词分析[D];北京语言文化大学;2000年
7 李卫亮;现代汉语分词系统中专名识别的实用策略[D];北京工业大学;2000年
8 娄(王廷);现代汉语分词系统通用性设计及切分歧义处理[D];北京工业大学;2000年
9 李朝阳;经济文献数据库计算机标引研究[D];南京农业大学;2000年
10 岳炳词;面向语言学研究的大规模汉语生语料库检索工具CCRLT[D];北京工业大学;2001年
【同被引文献】
中国期刊全文数据库 前6条
1 王晓龙,王开铸,李仲荣,白小华;最少分词问题及其解法[J];科学通报;1989年13期
2 张华平,刘群;基于N-最短路径方法的中文词语粗分模型[J];中文信息学报;2002年05期
3 周丽琴,杨季文,吕强;基于Web的字词频统计程序的设计与应用[J];苏州大学学报(自然科学版);2002年01期
4 张李义;李亚子;;基于反序词典的中文逆向最大匹配分词系统设计[J];现代图书情报技术;2006年08期
5 向玲;张庆林;;主观概率判断的支持理论[J];心理科学进展;2006年05期
6 何基报,茆诗松;对数正态分布场合的BAYES分析和大样本的后验分布[J];应用概率统计;1998年03期
【二级参考文献】
中国期刊全文数据库 前10条
1 王晓龙,王开铸,李仲荣,白小华;最少分词问题及其解法[J];科学通报;1989年13期
2 李国臣,刘开瑛,张永奎;汉语自动分词及歧义组合结构的处理[J];中文信息学报;1988年03期
3 揭春雨 ,刘源 ,梁南元;论汉语自动分词方法[J];中文信息学报;1989年01期
4 梁南元;汉语计算机自动分词知识[J];中文信息学报;1990年02期
5 何克抗,徐辉,孙波;书面汉语自动分词专家系统设计原理[J];中文信息学报;1991年02期
6 梁南元,刘源,沈旭昆,谭强,杨铁鹰;制订《信息处理用现代汉语常用词词表》的原则与问题的讨论[J];中文信息学报;1991年03期
7 韩世欣,王开铸;基于短语结构文法的分词研究[J];中文信息学报;1992年03期
8 曹焕光,郑家恒;自动分词软件质量的评价模型[J];中文信息学报;1992年04期
9 徐秉铮,詹剑,贺前华;基于神经网络的分词方法[J];中文信息学报;1993年02期
10 沈达阳,孙茂松,黄昌宁;汉语分词系统中的信息集成和最佳路径搜索方法[J];中文信息学报;1997年02期
【相似文献】
中国期刊全文数据库 前10条
1 杨尔弘;方莹;刘冬明;乔羽;;汉语自动分词和词性标注评测[J];中文信息学报;2006年01期
2 陈顺强;;彝文自动分词技术研究[J];中文信息学报;2011年03期
3 贺胜;卢亚军;;面向大规模语料库的全文检索系统研究[J];图书与情报;2008年04期
4 陈顺强;;信息处理用彝文分词规范研究[J];西南民族大学学报(自然科学版);2011年01期
5 贺胜;曲维光;许超;;面向中文自动分词的可扩展式电子词典研究[J];计算机工程与应用;2008年21期
6 魏晓宁;;基于隐马尔科夫模型的中文分词研究[J];电脑知识与技术(学术交流);2007年21期
7 何莘;王琬芜;;自然语言检索中的中文分词技术研究进展及应用[J];情报科学;2008年05期
8 马光志,李专;基于特征词的自动分词研究[J];华中科技大学学报(自然科学版);2003年03期
9 赵志靖,周静,冯锐,齐丙辰;智能人机交互中自动分词技术的实现[J];扬州大学学报(自然科学版);2005年03期
10 徐进鸿,邵品洪,李明霞;情报检索数学模型及若干技术进展[J];现代图书情报技术;1990年03期
中国重要会议论文全文数据库 前10条
1 钱揖丽;张虎;;汉语分词及词性标注自动校验方法研究[A];第一届学生计算语言学研讨会论文集[C];2002年
2 杨尔弘;方莹;乔羽;;汉语自动分词和词性标注评测[A];第二届全国学生计算语言学研讨会论文集[C];2004年
3 赵大明;;关于《现代汉语规范字典》的词性标注[A];中国辞书论集1999[C];1999年
4 徐艳华;;面向自动分词的三音节新词语构词法研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
5 邢富坤;宋柔;;自动词性标注中语法因素和词汇因素对英汉语的不同影响[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
6 郑泽之;;中文自动分词的一些问题[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
7 帕里旦·吐尔逊;艾山·吾买尔;吐尔根·依布拉音;早克热·卡德尔;阿力木江·艾沙;;基于最大熵的维吾尔语词性标注模型[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
8 许超;陈小荷;;试评两种商用机译软件的汉语分析能力[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
9 通拉嘎;;汉、蒙、藏、维分词与词性标注技术发展现状研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
10 艳红;王斯日古楞;;蒙古文词语切分在自动词性标注中的应用[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
中国重要报纸全文数据库 前10条
1 王萍;Web文本的知识化管理[N];计算机世界;2006年
2 教育部语信司;语言资源监测与服务论坛举行[N];语言文字周报;2010年
3 孟传良;略谈汉外词典的修订[N];中国图书商报;2005年
4 实习生 康晨;网络没有唯一:国内中文搜索引擎之比较[N];中国消费者报;2005年
5 田梦;软件篇软件只是工具[N];计算机世界;2007年
6 北京大学中文系 陆俭明;要对广大读者负责[N];中国社会科学院院报;2004年
7 王小宁;辞书应慎用“规范”冠名[N];人民政协报;2004年
8 语言所 董琨;错误百出 贻笑大方[N];中国社会科学院院报;2004年
9 教育部语言文字信息管理司司长李宇明;语言文字工作应当与时俱进[N];中国教育报;2001年
10 教育部语信司;国家语言资源监测与研究中心召开2007数据发布专题研讨会[N];语言文字周报;2008年
中国博士学位论文全文数据库 前10条
1 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
2 黄魏;植物营养诊断自动应答网络专家系统研究[D];华中农业大学;2007年
3 郭永辉;英汉机器翻译系统关键技术研究[D];解放军信息工程大学;2006年
4 姜维;统计中文词法分析及其强化学习机制的研究[D];哈尔滨工业大学;2007年
5 曹海龙;基于词汇化统计模型的汉语句法分析研究[D];哈尔滨工业大学;2006年
6 孙晓;中文词法分析的研究及其应用[D];大连理工大学;2010年
7 刘兴林;中文词汇知识获取算法和语义计算研究及应用[D];华南理工大学;2012年
8 朱聪慧;汉英动词次范畴相关技术的研究[D];哈尔滨工业大学;2009年
9 李晓黎;WEB信息检索与分类中的数据采掘研究[D];中国科学院研究生院(计算技术研究所);2001年
10 张华平;语言浅层分析与句子级新信息检测研究[D];中国科学院研究生院(计算技术研究所);2005年
中国硕士学位论文全文数据库 前10条
1 钱揖丽;中文文本分词及词性标注自动校对方法研究[D];山西大学;2003年
2 刘金宁;词性标注体系对中文分词的影响[D];大连理工大学;2010年
3 刘东旭;在自然汉语中进行分词和词性标注[D];电子科技大学;2003年
4 张虎;汉语语料库词性标注一致性检查及自动校对方法研究[D];山西大学;2005年
5 张磊;基于最大熵模型的汉语词性标注研究[D];大连理工大学;2008年
6 熊冬明;汉语自动分词和中文人名识别技术研究[D];浙江大学;2006年
7 樊立三;现代汉语语文辞书词性标注研究[D];鲁东大学;2006年
8 孔海霞;基于最大熵的汉语词性标注[D];大连理工大学;2007年
9 张卫;中文词性标注的研究与实现[D];南京师范大学;2007年
10 杨辉;汉语新词语发现及其词性标注方法研究[D];复旦大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026