收藏本站
《自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集》2001年
收藏 | 手机打开
二维码
手机客户端打开本文

统计和规则相结合的中文机构名称识别

张艳丽  黄德根  张丽静  杨元生  
【摘要】:中文机构名称是专名的一种,量大且层出不穷,因而大多不能收入词典,这便给自然语言处理,尤其是机器翻译和机器理解带来很大困扰.本文将统计和规则两种方法结合起来,建立了中文机构名称的识别模型.系统闭式精确率和召回率分别达92.5%和92%,开式精确率和召回率分别达88.5%和76.6%.

手机知网App
【引证文献】
中国期刊全文数据库 前2条
1 钟良伍;郑方;;基于中文机构名简称的检索方法研究[J];中文信息学报;2007年01期
2 俞鸿魁;张华平;刘群;吕学强;施水才;;基于层叠隐马尔可夫模型的中文命名实体识别[J];通信学报;2006年02期
中国重要会议论文全文数据库 前3条
1 俞鸿魁;张华平;刘群;吕学强;施水才;;基于层叠隐马尔可夫模型的中文命名实体识别[A];全国网络与信息安全技术研讨会'2005论文集(下册)[C];2005年
2 吴雪军;朱靖波;王会珍;叶娜;张宇新;;Co-Training的机器学习方法在中文机构名识别中的应用[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
3 俞鸿魁;张华平;刘群;;基于角色标注的中文机构名识别[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
中国硕士学位论文全文数据库 前5条
1 杨德来;SVM和最大熵相结合的中文机构名自动识别[D];大连理工大学;2006年
2 郭家清;基于条件随机场的命名实体识别研究[D];沈阳航空工业学院;2007年
3 毛婷婷;中文专有名词识别的研究[D];大连理工大学;2006年
4 张艳丽;中文机构名称的自动识别[D];大连理工大学;2003年
5 朱江涛;中文信息处理中命名实体识别问题的研究[D];沈阳航空工业学院;2006年
【参考文献】
中国期刊全文数据库 前3条
1 孙茂松,黄昌宁,高海燕,方捷;中文姓名的自动辨识[J];中文信息学报;1995年02期
2 黄德根,杨元生,王省,张艳丽,钟万勰;基于统计方法的中文姓名识别[J];中文信息学报;2001年02期
3 张小衡,王玲玲;中文机构名称的识别与分析[J];中文信息学报;1997年04期
【共引文献】
中国期刊全文数据库 前10条
1 黄昌宁,孙茂松;中文信息处理最新成果的检阅——记新加坡中文电脑国际会议ICCC’96[J];当代语言学;1996年04期
2 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
3 黄德根,马玉霞,杨元生;基于互信息的中文姓名识别方法[J];大连理工大学学报;2004年05期
4 张辉,徐健;中国组织机构名自动识别系统的设计与实现[J];电脑开发与应用;2002年01期
5 刘利东;基于组合度的汉语分词决策算法研究[J];德州学院学报;2003年02期
6 马颖华,王永成,苏贵洋;一种在汉语文本中抽取重复字串的快速算法[J];电子学报;2002年S1期
7 王显芳,杜利民;一种能够检测所有交叉歧义的汉语分词算法[J];电子学报;2004年01期
8 周俊生;戴新宇;尹存燕;陈家骏;;基于层叠条件随机场模型的中文机构名自动识别[J];电子学报;2006年05期
9 李建华,王晓龙;中文人名自动识别的一种有效方法[J];高技术通讯;2000年02期
10 张长利,赫枫龄,左万利;一种基于后缀数组的无词典分词方法[J];吉林大学学报(理学版);2004年04期
中国重要会议论文全文数据库 前10条
1 周蕾;李培峰;朱巧明;杨季文;;碎片分词与词结合提取的未登录词识别方法[A];第六届汉语词汇语义学研讨会论文集[C];2005年
2 侯敏;侯敞;;汉英机译系统译文质量的评测[A];世纪之交的中国应用语言学研究——第二届全国语言文字应用学术研讨会论文集[C];1998年
3 陈晓;;中文文本自动分词研究述要[A];第四届全国语言文字应用学术研讨会论文集[C];2005年
4 张树武;徐波;黄泰翼;;汉语大词汇/连续语音识别语言建模技术分析[A];第四届全国人机语音通讯学术会议论文集[C];1996年
5 高山;张艳;徐波;宗成庆;韩兆兵;;基于三元统计模型的汉语分词及标注一体化研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
6 季姮;罗振声;;基于反比概率模型和规则的中文姓名自动辨识系统[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
7 何燕;;基于单字词转移概率的未登录词识别[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
8 侯敏;;汉语自动分析中的若干问题与对策[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
9 张艳;徐波;;基于转换的错误学习方法的汉语词性自动标注研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
10 许超;陈小荷;;试评两种商用机译软件的汉语分析能力[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
中国博士学位论文全文数据库 前10条
1 郑泽芝;基于动态流通语料库(DCC)的汉语字母词语识别及考察研究[D];北京语言大学;2005年
2 刘忠;性质语意理论的提出与自然语言理解及其实现的研究[D];华东师范大学;2004年
3 隋岩;基于“动态流通语料库”的“有效字符串”提取研究[D];北京语言大学;2004年
4 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
5 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
6 李晓光;XML非完全结构查询处理中若干关键技术的研究[D];东北大学;2006年
7 姜韶华;科研项目管理中的文本挖掘方法研究及应用[D];大连理工大学;2006年
8 张素香;信息抽取中关键技术的研究[D];北京邮电大学;2007年
9 高红;基于统计语言模型的汉语浅层分析研究[D];大连理工大学;2007年
10 常娥;古籍智能处理技术研究[D];南京农业大学;2007年
中国硕士学位论文全文数据库 前10条
1 葛强;亲属关系逻辑推理专家系统的研究[D];河南大学;2005年
2 胡业江;中文姓名自动识别技术研究[D];华侨大学;2005年
3 朱珣;中文自动分词系统的研究[D];华中师范大学;2004年
4 何燕;任意类型的未登录词的识别研究[D];北京语言文化大学;2000年
5 张晗;日文文节切分中的姓名识别[D];大连理工大学;2000年
6 王省;基地统计和规则的中文姓名识别系统的研制[D];大连理工大学;2000年
7 李卫亮;现代汉语分词系统中专名识别的实用策略[D];北京工业大学;2000年
8 许勇;基于百科词典的知识获取系统的研究与实现[D];北京工业大学;2001年
9 罗智勇;现代汉语通用分词系统的技术与实现[D];北京工业大学;2002年
10 章成志;基于文本层次模型的Web概念挖掘研究[D];南京农业大学;2002年
【同被引文献】
中国期刊全文数据库 前10条
1 黄德根,朱和合,王昆仑,杨元生,钟万勰;基于最长次长匹配的汉语自动分词[J];大连理工大学学报;1999年06期
2 黄德根,马玉霞,杨元生;基于互信息的中文姓名识别方法[J];大连理工大学学报;2004年05期
3 张辉,徐健;中国组织机构名自动识别系统的设计与实现[J];电脑开发与应用;2002年01期
4 李蓉 ,叶世伟 ,史忠植;SVM-KNN分类器——一种提高SVM分类精度的新方法[J];电子学报;2002年05期
5 周俊生;戴新宇;尹存燕;陈家骏;;基于层叠条件随机场模型的中文机构名自动识别[J];电子学报;2006年05期
6 郭艳华,周昌乐;自然语言理解研究综述[J];杭州电子工业学院学报;2000年01期
7 周雅倩,郭以昆,黄萱菁,吴立德;基于最大熵方法的中英文基本名词短语识别[J];计算机研究与发展;2003年03期
8 刘群,张华平,俞鸿魁,程学旗;基于层叠隐马模型的汉语词法分析[J];计算机研究与发展;2004年08期
9 欧嘉致,陈凯江,李宗葛;基于NN/HMM混合模型的汉语地名识别系统[J];计算机工程与应用;2002年23期
10 张锋,樊孝忠,许云;基于统计的中文姓名识别方法研究[J];计算机工程与应用;2004年10期
中国重要会议论文全文数据库 前7条
1 季姮;罗振声;;基于反比概率模型和规则的中文姓名自动辨识系统[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 何燕;;基于单字词转移概率的未登录词识别[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
3 吴雪军;朱靖波;陈学耀;卓红霞;;基于统计和规则的人名识别方法[A];第一届学生计算语言学研讨会论文集[C];2002年
4 郭志立;;使用互信息辅助在篇章范围内识别命名实体[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
5 吴雪军;朱靖波;王会珍;叶娜;张宇新;;Co-Training的机器学习方法在中文机构名识别中的应用[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
6 雷静;;汉语机构名的构成模式[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
7 俞鸿魁;张华平;刘群;;基于角色标注的中文机构名识别[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
中国硕士学位论文全文数据库 前1条
1 任登君;面向机器学习方法的命名实体识别[D];东北大学;2005年
【二级引证文献】
中国重要会议论文全文数据库 前3条
1 陈禹;史晓东;向晓雯;张润延;;基于混合方法的中文命名实体识别[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
2 高嵩;周强;;一种中文分词后处理反馈算法[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
3 冯元勇;孙乐;张大鲲;李文波;;基于单字提示特征的中文命名实体识别快速算法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国博士学位论文全文数据库 前2条
1 周顺先;文本信息抽取模型及算法研究[D];湖南大学;2007年
2 傅魁;基于Web的本体学习研究[D];武汉理工大学;2007年
中国硕士学位论文全文数据库 前8条
1 王蕾;基于转换学习的专有名词识别[D];苏州大学;2006年
2 邹纲;中文新词语自动检测研究[D];中国科学院研究生院(计算技术研究所);2004年
3 杨德来;SVM和最大熵相结合的中文机构名自动识别[D];大连理工大学;2006年
4 郭家清;基于条件随机场的命名实体识别研究[D];沈阳航空工业学院;2007年
5 朱江涛;中文信息处理中命名实体识别问题的研究[D];沈阳航空工业学院;2006年
6 武玉洲;汉语文本人名识别改进方法研究[D];北京语言大学;2007年
7 徐照财;基于Agent的专题搜索引擎爬虫的研究[D];江苏大学;2007年
8 俞洋;基于主动服务的用户导航系统[D];武汉理工大学;2008年
【二级参考文献】
中国期刊全文数据库 前4条
1 付国宏,王晓龙;汉语词语边界自动划分的模型与算法[J];计算机研究与发展;1999年09期
2 吴胜远;一种汉语分词方法[J];计算机研究与发展;1996年04期
3 孙茂松,黄昌宁,高海燕,方捷;中文姓名的自动辨识[J];中文信息学报;1995年02期
4 张小衡;从“qinghuadaxue”谈起逐步实现中文智能输入[J];中文信息;1996年05期
【相似文献】
中国期刊全文数据库 前10条
1 尹广琴,范循轩;英语双词动词例谈[J];安徽农业技术师范学院学报;1996年03期
2 姜顶;;浅析法律英语中的同义词并用现象和翻译策略[J];科教导刊(中旬刊);2010年05期
3 张河川;辜鸿铭的英语特色[J];贵州教育学院学报;2002年05期
4 张小衡,王玲玲;中文机构名称的识别与分析[J];中文信息学报;1997年04期
5 周晓林,庄捷,于淼;言语产生中双词素词的语音编码[J];心理学报;2002年03期
6 顾斌;;英语双词复合名词重音规律初探[J];贵州大学学报(社会科学版);1987年03期
7 徐启慧;论俄语中的合成称名[J];外语学刊;1993年01期
8 刘国辉;试论英语词汇的结构分类[J];四川师范学院学报(哲学社会科学版);1998年01期
9 侯仁锋;照搬不得[J];日语知识;1999年03期
10 游立英;“-mate”的译法[J];大学英语;2000年01期
中国重要会议论文全文数据库 前2条
1 张艳丽;黄德根;张丽静;杨元生;;统计和规则相结合的中文机构名称识别[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 ;Microwave-Accelerated Palladium-Catalyzed Carbonylative Cyclization Reactions of 2-Iodophenol with Alkynes:Rapid and Efficient Synthesis of Chromen-2-one Derivatives[A];中国化学会全国微波化学学术研讨会论文摘要集[C];2005年
中国博士学位论文全文数据库 前1条
1 高茂庭;文本聚类分析若干问题研究[D];天津大学;2007年
中国硕士学位论文全文数据库 前3条
1 张艳丽;中文机构名称的自动识别[D];大连理工大学;2003年
2 蒯越瀚;基于时空兴趣点的无监督行为识别研究[D];沈阳航空航天大学;2013年
3 丁敏;汉词的形音认知加工关系[D];华东师范大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026