收藏本站
《自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集》2001年
收藏 | 手机打开
二维码
手机客户端打开本文

新词语自动识别方法研究

郑家恒  李文花  
【摘要】:本文在对加工过的网上文本语料统计的基础上,首先用N元递增分步算法,获取含新词语的汉字串:经过初筛选,建立新词语候选词库:最后以构词法为依据,对剩余词条进行新词语的识别.封闭测试:召回率为97%,准确率为85%以上.

手机知网App
【参考文献】
中国期刊全文数据库 前1条
1 郑家恒,李鑫,谭红叶;基于语料库的中文姓名识别方法研究[J];中文信息学报;2000年01期
【共引文献】
中国期刊全文数据库 前10条
1 黄德根,马玉霞,杨元生;基于互信息的中文姓名识别方法[J];大连理工大学学报;2004年05期
2 王力红,杨剑,尹荧,李云波,孙亚萍;旅游信息数据库汉语智能接口的研究[J];计算机工程与应用;2002年01期
3 张锋,樊孝忠,许云;基于统计的中文姓名识别方法研究[J];计算机工程与应用;2004年10期
4 毋琳;郑逢斌;乔保军;汤赛丽;;HENU汉语分词系统中的中文人名识别算法[J];计算机工程与应用;2006年14期
5 王力红,杨剑,李洪,李云波,孙亚萍;汉语智能接口的自动分词研究[J];计算机工程;2001年08期
6 庄明,老松杨,吴玲达;一种统计和词性相结合的命名实体发现方法[J];计算机应用;2004年01期
7 李成城,赵述芳,刘建毅,钟义信;基于动态规划算法的专有名词切分[J];计算机应用研究;2005年07期
8 郭曙纶;汉语人名标注及其方法[J];零陵学院学报;2003年03期
9 金翔宇,孙正兴,张福炎;一种中文文档的非受限无词典抽词方法[J];中文信息学报;2001年06期
10 黄德根,岳广玲,杨元生;基于统计的中文地名识别[J];中文信息学报;2003年02期
中国重要会议论文全文数据库 前9条
1 马玉霞;黄德根;杨元生;;一种改进的中文姓名识别方法[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
2 罗智勇;宋柔;荀恩东;;一种基于可信度的人名识别方法[A];第二届全国学生计算语言学研讨会论文集[C];2004年
3 董宇;;称谓语与人名自动识别[A];第二届全国学生计算语言学研讨会论文集[C];2004年
4 朱江涛;赵丽奎;蔡东风;;基于最大熵模型的中文姓名识别方法初探[A];第二届全国学生计算语言学研讨会论文集[C];2004年
5 郑泽之;张普;杨建国;;基于语料库的字母词语自动提取研究[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
6 钱小飞;陈小荷;董宇;何晓丽;;面向大型叙事作品的指人成分识别[A];第三届学生计算语言学研讨会论文集[C];2006年
7 郑家恒;谭红叶;王兴义;;基于模式匹配的中文专有名词识别[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
8 刘知远;孙茂松;;基于WEB的计算机领域新术语的自动检测[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
9 余军;陈晓鸥;;命名实体识别:One-at-a-time or All-at-once?Word-based or Character-based?[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
中国博士学位论文全文数据库 前5条
1 隋岩;基于“动态流通语料库”的“有效字符串”提取研究[D];北京语言大学;2004年
2 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
3 李晓光;XML非完全结构查询处理中若干关键技术的研究[D];东北大学;2006年
4 张素香;信息抽取中关键技术的研究[D];北京邮电大学;2007年
5 高红;基于统计语言模型的汉语浅层分析研究[D];大连理工大学;2007年
中国硕士学位论文全文数据库 前10条
1 潘景剑;具有中文人名识别功能的汉语自动分词算法研究[D];河北工业大学;2006年
2 胡业江;中文姓名自动识别技术研究[D];华侨大学;2005年
3 朱珣;中文自动分词系统的研究[D];华中师范大学;2004年
4 罗智勇;现代汉语通用分词系统的技术与实现[D];北京工业大学;2002年
5 张艳丽;中文机构名称的自动识别[D];大连理工大学;2003年
6 孟迎;基于统计的机器学习的中文命名实体识别[D];昆明理工大学;2004年
7 孟利青;基于DSP的中文电子阅读系统的研究[D];辽宁工程技术大学;2005年
8 吴志峰;基于概念特征的中文文本分类研究[D];河北大学;2005年
9 乔羽;基于最大熵模型的中文人名识别方法研究[D];山西大学;2005年
10 吴雪军;面向信息抽取的命名实体识别与模板获取技术研究[D];东北大学;2005年
【二级参考文献】
中国期刊全文数据库 前1条
1 孙茂松,黄昌宁,高海燕,方捷;中文姓名的自动辨识[J];中文信息学报;1995年02期
【相似文献】
中国期刊全文数据库 前10条
1 胡媛媛;胡芳芳;;新词语叠用现象折射出的社会心态[J];现代语文(语言研究版);2011年06期
2 郭旭东;;年度新词语所折射出的社会时代气息[J];大家;2011年16期
3 邵晓阳;;关于新词语规范化的思考[J];湖北第二师范学院学报;2011年06期
4 兰雪香;李秀文;伍和忠;;柳城县六塘壮语新词语初探[J];百色学院学报;2011年02期
5 战音平;陈姗姗;金鑫;;汉语常用字构词能力的统计分析[J];语文学刊;2011年09期
6 周蕾;;“给力”新词初探[J];群文天地;2011年12期
7 周明海;;辞书编纂现代化趋势下的新词语词典编纂——评《2007汉语新词语》《2008汉语新词语》[J];辞书研究;2011年04期
8 余娜;;从彭泽润、李葆嘉《语言理论》看分词连写[J];现代语文(语言研究版);2011年08期
9 刘启成;;汉语新词的英译原则及策略[J];大家;2011年14期
10 王思妮;;对网络新词语“X族”的替换分析[J];北方文学(下半月);2010年09期
中国重要会议论文全文数据库 前10条
1 郑家恒;李文花;;新词语自动识别方法研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 徐艳华;;面向自动分词的三音节新词语构词法研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 李燕;;新词语的研究及其在对外汉语教学中的应用[A];第二届全国学生计算语言学研讨会论文集[C];2004年
4 李衍妮;;谈新词语中带体词性宾语的动词[A];第二届全国学生计算语言学研讨会论文集[C];2004年
5 颜伟;亢世勇;;基于语料库的现代汉语新词语动词语法特征的研究[A];第一届学生计算语言学研讨会论文集[C];2002年
6 亢世勇;;语料库技术在新词语词典开发中的具体应用[A];中国辞书论集2000[C];2000年
7 李小明;王亚莉;易立夫;杨静;孙金城;;自动分词中的单字虚词处理[A];新世纪的现代语音学——第五届全国现代语音学学术会议论文集[C];2001年
8 鲍明凌;亢世勇;;基于数据库的现代汉语新词语缩略语的研究[A];第一届学生计算语言学研讨会论文集[C];2002年
9 黄昌宁;高剑峰;李沐;;对自动分词的反思[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
10 周洪波;;从隐性到显性:新词语产生的重要途径——兼谈新词新语词典的编写[A];语言文字应用研究论文集(Ⅱ)[C];2004年
中国重要报纸全文数据库 前10条
1 本报记者 刘昊;新词语一年诞生396条[N];北京日报;2010年
2 本报记者 任丽梅;我国2009年出现新词语396条[N];中国改革报;2010年
3 吕永海;话说“新词语”[N];语言文字周报;2011年
4 本报评论员刘文宁;新词语涌现折射社会发展轨迹[N];工人日报;2003年
5 记者 刘昊;汉语去年又增254条新词语[N];北京日报;2008年
6 刘毅;中文新词语专家论是非[N];团结报;2000年
7 商务印书馆汉语编辑室主任 周洪波;新词语犹如朝日[N];北京日报;2000年
8 记者 李莉;教育部发布新词语 次贷和谐号等上榜[N];中华新闻报;2008年
9 国家语委副主任、教育部语言文字信息管理司司长 李宇明;发布年度新词语的思考[N];光明日报;2007年
10 孙宇 吴晶;去年流行字:涨跌常见,肉也上榜[N];新华每日电讯;2008年
中国博士学位论文全文数据库 前10条
1 孙荣实;汉语新词语运用研究[D];复旦大学;2004年
2 刘晓梅;当代汉语新词语研究[D];厦门大学;2003年
3 周琳娜;清代新词新义位发展演变研究[D];山东大学;2009年
4 黄魏;植物营养诊断自动应答网络专家系统研究[D];华中农业大学;2007年
5 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
6 闫从发;基于《汉语大词典》语料库的时代汉语词汇研究[D];山东大学;2009年
7 肖模艳;现代汉语比喻造词研究[D];厦门大学;2008年
8 宋琳;基于《汉语大词典》语料库的魏晋新词语研究[D];山东大学;2011年
9 史艳岚;基于中国主流报纸动态流通语料库的对外汉语报刊新闻主题词群及相关研究[D];北京语言大学;2006年
10 杨彬;心智的门铃[D];苏州大学;2008年
中国硕士学位论文全文数据库 前10条
1 高原;[D];山西大学;2004年
2 周根飞;“刀”、“雷”、“囧”、“槑”:网络翻新词语个案研究[D];安徽大学;2010年
3 谢莉琳;试论对外汉语报刊阅读课中新词语的教学[D];暨南大学;2012年
4 张红;汉语经贸新词语与翻译[D];对外经济贸易大学;2000年
5 何苗;现代汉语二十年新词语管窥[D];西南师范大学;2002年
6 王玉珊;从新词语谈当今社会文化[D];延边大学;2003年
7 许荣荣;中文文本自动分词技术与算法研究[D];郑州大学;2010年
8 普布旦增;藏文自动分词技术方法研究[D];西藏大学;2010年
9 伊兴荣;从《新华新词语词典》看新词语造词法[D];新疆师范大学;2006年
10 段倩倩;面向信息处理的带典型前缀派生词的识别分析[D];上海师范大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026