收藏本站
《第四届全国学生计算语言学研讨会会议论文集》2008年
收藏 | 手机打开
二维码
手机客户端打开本文

基于构成模式的汉语机构名识别

雷静  张舵  冯霞  
【摘要】:汉语机构名识别是现代汉语未登录词识别中最难实现的一项,至今未能找到十分令人满意的解决方法。本文提出了一种基于构成模式的汉语机构名识别方法,其基本思想是根据机构名的构成模式,建立模式的转移矩阵。在转移矩阵的基础上用自动机算法实现中文机构名的自动匹配。

【参考文献】
中国期刊全文数据库 前2条
1 张小衡,王玲玲;中文机构名称的识别与分析[J];中文信息学报;1997年04期
2 王宁,葛瑞芳,苑春法,黄锦辉,李文捷;中文金融新闻中公司名的识别[J];中文信息学报;2002年02期
中国重要会议论文全文数据库 前1条
1 吴雪军;朱靖波;王会珍;叶娜;张宇新;;Co-Training的机器学习方法在中文机构名识别中的应用[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
【共引文献】
中国期刊全文数据库 前10条
1 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
2 张辉,徐健;中国组织机构名自动识别系统的设计与实现[J];电脑开发与应用;2002年01期
3 马颖华,王永成,苏贵洋;一种在汉语文本中抽取重复字串的快速算法[J];电子学报;2002年S1期
4 周俊生;戴新宇;尹存燕;陈家骏;;基于层叠条件随机场模型的中文机构名自动识别[J];电子学报;2006年05期
5 郑家恒,张辉;基于HMM的中国组织机构名自动识别[J];计算机应用;2002年11期
6 庄明,老松杨,吴玲达;一种统计和词性相结合的命名实体发现方法[J];计算机应用;2004年01期
7 王桂平,林鹏;基于双侧语料评价模型的专业词汇识别算法[J];计算机与现代化;2005年09期
8 韩客松,王永成,陈桂林;无词典高频字串快速提取和统计算法研究[J];中文信息学报;2001年02期
9 金翔宇,孙正兴,张福炎;一种中文文档的非受限无词典抽词方法[J];中文信息学报;2001年06期
10 王宁,葛瑞芳,苑春法,黄锦辉,李文捷;中文金融新闻中公司名的识别[J];中文信息学报;2002年02期
中国重要会议论文全文数据库 前10条
1 陈晓;;中文文本自动分词研究述要[A];第四届全国语言文字应用学术研讨会论文集[C];2005年
2 俞鸿魁;张华平;刘群;吕学强;施水才;;基于层叠隐马尔可夫模型的中文命名实体识别[A];全国网络与信息安全技术研讨会'2005论文集(下册)[C];2005年
3 何燕;;基于单字词转移概率的未登录词识别[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
4 张艳丽;黄德根;张丽静;杨元生;;统计和规则相结合的中文机构名称识别[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
5 郭志立;;使用互信息辅助在篇章范围内识别命名实体[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
6 吴雪军;朱靖波;王会珍;叶娜;张宇新;;Co-Training的机器学习方法在中文机构名识别中的应用[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
7 俞鸿魁;张华平;刘群;;基于角色标注的中文机构名识别[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
8 李斌;;中文单字国名简称的自动识别[A];第二届全国学生计算语言学研讨会论文集[C];2004年
9 乔春庚;肖诗斌;孙丽华;施水才;;规则与统计相结合的案件名称识别[A];第三届学生计算语言学研讨会论文集[C];2006年
10 郑家恒;谭红叶;王兴义;;基于模式匹配的中文专有名词识别[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
中国博士学位论文全文数据库 前5条
1 刘忠;性质语意理论的提出与自然语言理解及其实现的研究[D];华东师范大学;2004年
2 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
3 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
4 李晓光;XML非完全结构查询处理中若干关键技术的研究[D];东北大学;2006年
5 姜韶华;科研项目管理中的文本挖掘方法研究及应用[D];大连理工大学;2006年
中国硕士学位论文全文数据库 前10条
1 何燕;任意类型的未登录词的识别研究[D];北京语言文化大学;2000年
2 张晗;日文文节切分中的姓名识别[D];大连理工大学;2000年
3 王省;基地统计和规则的中文姓名识别系统的研制[D];大连理工大学;2000年
4 李卫亮;现代汉语分词系统中专名识别的实用策略[D];北京工业大学;2000年
5 许勇;基于百科词典的知识获取系统的研究与实现[D];北京工业大学;2001年
6 罗智勇;现代汉语通用分词系统的技术与实现[D];北京工业大学;2002年
7 章成志;基于文本层次模型的Web概念挖掘研究[D];南京农业大学;2002年
8 张艳丽;中文机构名称的自动识别[D];大连理工大学;2003年
9 林鹏;汉语疑问句理解系统研究与实现——虚拟信息顾问系统之问题理解子系统[D];重庆大学;2004年
10 杨孝光;中文文本自动分类系统研究—汉语分词及分类器的设计[D];电子科技大学;2004年
【二级参考文献】
中国期刊全文数据库 前3条
1 王宁,葛瑞芳,苑春法,黄锦辉,李文捷;中文金融新闻中公司名的识别[J];中文信息学报;2002年02期
2 张小衡,王玲玲;中文机构名称的识别与分析[J];中文信息学报;1997年04期
3 张小衡;从“qinghuadaxue”谈起逐步实现中文智能输入[J];中文信息;1996年05期
中国重要会议论文全文数据库 前1条
1 张艳丽;黄德根;张丽静;杨元生;;统计和规则相结合的中文机构名称识别[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
【相似文献】
中国重要会议论文全文数据库 前10条
1 雷静;张舵;冯霞;;基于构成模式的汉语机构名识别[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
2 曾依灵;许洪波;;网络热点信息发现研究[A];全国网络与信息安全技术研讨会论文集(下册)[C];2007年
3 何燕;;基于单字词转移概率的未登录词识别[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
4 周蕾;李培峰;朱巧明;杨季文;;碎片分词与词结合提取的未登录词识别方法[A];第六届汉语词汇语义学研讨会论文集[C];2005年
5 张玥杰;徐智婷;钱晶;张涛;;自然语言处理中专名识别方法的研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
6 韩艳;林煜熙;姚建民;;基于统计信息的未登录词的扩展识别方法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
7 李斌;陈小荷;;面向中文陌生文本的人机交互式分词方法[A];第三届学生计算语言学研讨会论文集[C];2006年
8 黄昌宁;赵海;;由字构词——中文分词新方法[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
9 江丰;刘慧;陈玉泉;陆汝占;;一个可扩展的汉语词法和句法分析一体化系统[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
10 陈晓;靳光瑾;黄昌宁;;基于字的分词方法的实验研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
中国博士学位论文全文数据库 前3条
1 陈博;WEB文本情感分类中关键问题的研究[D];北京邮电大学;2008年
2 高红;基于统计语言模型的汉语浅层分析研究[D];大连理工大学;2007年
3 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
中国硕士学位论文全文数据库 前10条
1 王帅;双字低频未登录词识别研究[D];南京师范大学;2012年
2 魏莎莎;一种中文未登录词识别及词典设计新方法[D];西南大学;2011年
3 朱明强;基于词典和词频分析的论坛语料未登录词识别研究[D];西南大学;2012年
4 程冲;信息检索用汉语分词与未登录词识别技术研究[D];南京农业大学;2007年
5 周蕾;中文未登录词识别的研究及在汉字输入法中的应用[D];苏州大学;2005年
6 崔明明;基于机器学习的中文分词的研究与实现[D];沈阳工业大学;2009年
7 张剑锋;规则与统计相结合的中文分词方法研究[D];山西大学;2008年
8 刘婷;中文自动分词法在全文检索中的研究及应用[D];南京航空航天大学;2007年
9 李兆福;基于K最短路径的中文分词算法研究与实现[D];哈尔滨工程大学;2009年
10 孙建国;领域汉语理解中的智能分词系统的研究与实现及其在产品设计中的应用[D];西安电子科技大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026