收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

分词系统计量研究与改进方案

曲维光  
【摘要】:本文利用中科院计算所ICTCLAS系统对《人民日报》1998年1月语料进行标注,并与北京大学免费发布的《人民日报》1998年1月标注语料进行比对分析,找出ICTCLAS系统存在的一些缺陷,提出进一步提高标注效果的方法。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 辛红;通过比较讲清语法概念[J];雁北师范学院学报;1994年04期
2 罗小强,王仁华;汉语音节全分词算法[J];中国科学技术大学学报;1995年02期
3 匡世玉,蔡德全;分词(Participle)用法点滴[J];自贡师范高等专科学校学报;1997年02期
4 路式成 ,罗兴伟;英语名词(代词)+“-ing”分词复合结构[J];解放军外国语学院学报;1981年01期
5 梅勇,王群生,徐秉铮;基于 FoxPro for Windows 的汉语语料库系统的构造[J];华南理工大学学报(自然科学版);1998年01期
6 周光华;;-ed分词的功能[J];英语知识;1998年07期
7 许国强;论英语“反向心理动词”[J];解放军外国语学院学报;1993年06期
8 惠芡;英语“特殊被动语态”浅探[J];南都学坛;1995年02期
9 朱福荣;内地与香港部分词语对照[J];中国工商;1997年10期
10 张彻;浅议动词中分词的介词作用[J];内蒙古科技与经济;2002年09期
11 石凯民;;不能作定语的第二分词[J];德语学习;2007年03期
12 阮利东;;分词的用法归纳及学习策略浅谈[J];教师;2010年19期
13 袁毓林;关于分词规范和规范词表的若干意见[J];语言文字应用;1997年04期
14 李万勇;;英语非谓语动词的词性界定[J];泰安教育学院学报岱宗学刊;2007年01期
15 李欣;;留学生阅读中的分词问题[J];科教文汇(下旬刊);2008年05期
16 王鹏侠;分词的逻辑主语与句中主语不一致的两种情况[J];甘肃教育;1998年10期
17 林红;an interested look与an interesting look的区别[J];大学英语;1999年01期
18 强增吉;英语动词+-ing分词结构剖析[J];外国语(上海外国语大学学报);1984年06期
19 张爱卿;谈谈无归属分词等的弹性[J];大学英语;1988年05期
20 强增吉;英语问题解答[J];外国语(上海外国语大学学报);1984年04期
中国重要会议论文全文数据库 前10条
1 诺明花;张立强;刘汇丹;吴健;丁治明;;汉藏短语抽取[A];第五届全国青年计算语言学研讨会论文集[C];2010年
2 陈肖霞;王霞;;对朗读语料的音素标注与研究[A];第六届全国现代语音学学术会议论文集(下)[C];2003年
3 刘昆;张建平;颜永红;;统计语言模型中语料的选择[A];中国声学学会2005年青年学术会议[CYCA'05]论文集[C];2005年
4 徐润华;陈小荷;;一种利用注疏的《左传》分词新方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
5 曲维光;;分词系统计量研究与改进方案[A];第二届全国学生计算语言学研讨会论文集[C];2004年
6 李正华;车万翔;刘挺;;基于XML的语言技术平台[A];第五届全国青年计算语言学研讨会论文集[C];2010年
7 孟凡东;徐金安;姜文斌;刘群;;异种语料融合方法:基于统计的中文词法分析应用[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
8 蒋宏飞;曹海龙;杨沐昀;;基于大规模语料的中文词聚类研究与实现[A];第二届全国学生计算语言学研讨会论文集[C];2004年
9 曲维光;;语料自动校对中一致性问题的处理[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
10 刘亚斌;李爱军;;朗读语料与自然口语的差异分析[A];第六届全国人机语音通讯学术会议论文集[C];2001年
中国博士学位论文全文数据库 前10条
1 黄建年;农业古籍的计算机断句标点与分词标引研究[D];南京农业大学;2009年
2 孙晓;中文词法分析的研究及其应用[D];大连理工大学;2010年
3 王君泽;基于大规模问答语料的问题检索系统[D];华中科技大学;2010年
4 朱聪慧;汉英动词次范畴相关技术的研究[D];哈尔滨工业大学;2009年
5 李思;WEB观点挖掘中关键问题的研究[D];北京邮电大学;2012年
6 陈劲光;基于云模型的中文面向查询多文档自动文摘研究[D];华中师范大学;2011年
7 罗芳;意见挖掘中若干关键问题研究[D];武汉理工大学;2011年
8 刘磊;概念内涵属性计算研究[D];上海交通大学;2011年
9 赵世奇;基于统计的复述获取与生成技术研究[D];哈尔滨工业大学;2009年
10 侯锋;中文报业出版的文字质量智能辅助控制技术研究[D];国防科学技术大学;2010年
中国硕士学位论文全文数据库 前10条
1 刘东生;面向专利文献的中文分词技术的研究[D];沈阳航空工业学院;2010年
2 郑秀玲;“不X是”字串分词歧解及消歧策略[D];上海师范大学;2011年
3 毋菲;数值信息的抽取方法研究[D];山西大学;2010年
4 郭明;基于文本分类技术的文本情感倾向性研究[D];郑州大学;2010年
5 朱明强;基于词典和词频分析的论坛语料未登录词识别研究[D];西南大学;2012年
6 张海燕;基于分词的中文文本自动分类研究与实现[D];湖南大学;2002年
7 陈思;中文文本投诉信息自动分类系统研究[D];东北师范大学;2010年
8 赵春红;外包数据库模型中文本数据完整性检测方案的研究[D];燕山大学;2010年
9 卢育红;半结构化药物数据智能分类技术研究与系统实现(全日制专业学位)[D];北京交通大学;2011年
10 卢忠良;基于多类的汉语文本自动分类研究[D];中国人民解放军国防科学技术大学;2002年
中国重要报纸全文数据库 前10条
1 温端政;山西社科院试建“汉语俗语语料数据库”[N];中国社会科学院院报;2003年
2 记者 侯梅竹;汉语语料检索系统问世[N];计算机世界;2004年
3 高岚;海量在线做搜索引擎“卖水人”[N];中国计算机报;2004年
4 佟文柱;语料更实 题材更广 语速更快[N];中国教师报;2002年
5 ;语言信息处理呼唤知识应用[N];中国计算机报;2003年
6 陈劲宏;东方快车2003之新鲜体验[N];中国电脑教育报;2002年
7 陆元婕;聪明的搜索引擎[N];中国计算机报;2001年
8 本报记者 侯闯;让企业不再“眼花”[N];计算机世界;2003年
9 记者 吕诺;掌握千字万词,即可看懂九成中文读物[N];新华每日电讯;2006年
10 本报记者 姚从权;我国自己的大规模口语库即将建成[N];中国社会科学院院报;2004年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978