收藏本站
《自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集》2001年
收藏 | 手机打开
二维码
手机客户端打开本文

基于反比概率模型和规则的中文姓名自动辨识系统

季姮  罗振声  
【摘要】:中文姓名的辨识是自动分词、自动文摘的基础.我们提出了基于语料库统计的反比姓名概率模型,并结合上下文模式、邻接链、特殊姓、位置依存信息等四个辨识模块,设计了一个中文姓名辨识系统.本文描述了本系统的算法,测试结果表明系统有较高的召回率和精确率,召回率达到93.75%,精确率达到83.95%.

手机知网App
【引证文献】
中国期刊全文数据库 前2条
1 俞鸿魁;张华平;刘群;吕学强;施水才;;基于层叠隐马尔可夫模型的中文命名实体识别[J];通信学报;2006年02期
2 张华平,刘群;基于角色标注的中国人名自动识别研究[J];计算机学报;2004年01期
中国重要会议论文全文数据库 前4条
1 俞鸿魁;张华平;刘群;吕学强;施水才;;基于层叠隐马尔可夫模型的中文命名实体识别[A];全国网络与信息安全技术研讨会'2005论文集(下册)[C];2005年
2 郭志立;;使用互信息辅助在篇章范围内识别命名实体[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
3 于传武;李生;陈鄞;赵铁军;;基于混合策略的汉语未登录词整体识别[A];第一届学生计算语言学研讨会论文集[C];2002年
4 俞鸿魁;张华平;刘群;;基于角色标注的中文机构名识别[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
【参考文献】
中国期刊全文数据库 前1条
1 孙茂松,黄昌宁,高海燕,方捷;中文姓名的自动辨识[J];中文信息学报;1995年02期
【共引文献】
中国期刊全文数据库 前10条
1 黄昌宁,孙茂松;中文信息处理最新成果的检阅——记新加坡中文电脑国际会议ICCC’96[J];当代语言学;1996年04期
2 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
3 黄德根,马玉霞,杨元生;基于互信息的中文姓名识别方法[J];大连理工大学学报;2004年05期
4 刘利东;基于组合度的汉语分词决策算法研究[J];德州学院学报;2003年02期
5 马颖华,王永成,苏贵洋;一种在汉语文本中抽取重复字串的快速算法[J];电子学报;2002年S1期
6 王显芳,杜利民;一种能够检测所有交叉歧义的汉语分词算法[J];电子学报;2004年01期
7 李建华,王晓龙;中文人名自动识别的一种有效方法[J];高技术通讯;2000年02期
8 陈桂林,王永成,韩客松,王刚;一种改进的快速分词算法[J];计算机研究与发展;2000年04期
9 王力红,杨剑,尹荧,李云波,孙亚萍;旅游信息数据库汉语智能接口的研究[J];计算机工程与应用;2002年01期
10 张仰森,徐波,曹元大,宗成庆;基于姓氏驱动的中国姓名自动识别方法[J];计算机工程与应用;2003年04期
中国重要会议论文全文数据库 前10条
1 周蕾;李培峰;朱巧明;杨季文;;碎片分词与词结合提取的未登录词识别方法[A];第六届汉语词汇语义学研讨会论文集[C];2005年
2 侯敏;侯敞;;汉英机译系统译文质量的评测[A];世纪之交的中国应用语言学研究——第二届全国语言文字应用学术研讨会论文集[C];1998年
3 张树武;徐波;黄泰翼;;汉语大词汇/连续语音识别语言建模技术分析[A];第四届全国人机语音通讯学术会议论文集[C];1996年
4 高山;张艳;徐波;宗成庆;韩兆兵;;基于三元统计模型的汉语分词及标注一体化研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
5 何燕;;基于单字词转移概率的未登录词识别[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
6 侯敏;;汉语自动分析中的若干问题与对策[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
7 张艳丽;黄德根;张丽静;杨元生;;统计和规则相结合的中文机构名称识别[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
8 张艳;徐波;;基于转换的错误学习方法的汉语词性自动标注研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
9 许超;陈小荷;;试评两种商用机译软件的汉语分析能力[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
10 于传武;李生;陈鄞;赵铁军;;基于混合策略的汉语未登录词整体识别[A];第一届学生计算语言学研讨会论文集[C];2002年
中国博士学位论文全文数据库 前7条
1 刘忠;性质语意理论的提出与自然语言理解及其实现的研究[D];华东师范大学;2004年
2 隋岩;基于“动态流通语料库”的“有效字符串”提取研究[D];北京语言大学;2004年
3 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
4 李晓光;XML非完全结构查询处理中若干关键技术的研究[D];东北大学;2006年
5 张素香;信息抽取中关键技术的研究[D];北京邮电大学;2007年
6 常娥;古籍智能处理技术研究[D];南京农业大学;2007年
7 郑泽芝;基于动态流通语料库(DCC)的汉语字母词语识别及考察研究[D];北京语言大学;2005年
中国硕士学位论文全文数据库 前10条
1 何燕;任意类型的未登录词的识别研究[D];北京语言文化大学;2000年
2 王省;基地统计和规则的中文姓名识别系统的研制[D];大连理工大学;2000年
3 李卫亮;现代汉语分词系统中专名识别的实用策略[D];北京工业大学;2000年
4 许勇;基于百科词典的知识获取系统的研究与实现[D];北京工业大学;2001年
5 罗智勇;现代汉语通用分词系统的技术与实现[D];北京工业大学;2002年
6 章成志;基于文本层次模型的Web概念挖掘研究[D];南京农业大学;2002年
7 张艳丽;中文机构名称的自动识别[D];大连理工大学;2003年
8 刘东旭;在自然汉语中进行分词和词性标注[D];电子科技大学;2003年
9 王丁;基于中文文本分类的自动诊病系统[D];哈尔滨理工大学;2003年
10 骆彬;汉语新词语辅助识别系统的研制[D];中国社会科学院研究生院;2003年
【同被引文献】
中国期刊全文数据库 前10条
1 刘群,张华平,俞鸿魁,程学旗;基于层叠隐马模型的汉语词法分析[J];计算机研究与发展;2004年08期
2 张锋,樊孝忠,许云;基于统计的中文姓名识别方法研究[J];计算机工程与应用;2004年10期
3 张华平,刘群;基于角色标注的中国人名自动识别研究[J];计算机学报;2004年01期
4 周波;杨国纬;;基于贝叶斯算法的中国人名识别[J];计算机应用;2006年04期
5 刘秉伟,黄萱菁,郭以昆,吴立德;基于统计方法的中文姓名识别[J];中文信息学报;2000年03期
6 吕雅娟,赵铁军,杨沐昀,于浩,李生;基于分解与动态规划策略的汉语未登录词识别[J];中文信息学报;2001年01期
7 王宁,葛瑞芳,苑春法,黄锦辉,李文捷;中文金融新闻中公司名的识别[J];中文信息学报;2002年02期
8 张华平,刘群;基于N-最短路径方法的中文词语粗分模型[J];中文信息学报;2002年05期
9 孙茂松,黄昌宁,高海燕,方捷;中文姓名的自动辨识[J];中文信息学报;1995年02期
10 张小衡,王玲玲;中文机构名称的识别与分析[J];中文信息学报;1997年04期
中国重要会议论文全文数据库 前2条
1 何燕;;基于单字词转移概率的未登录词识别[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 张艳丽;黄德根;张丽静;杨元生;;统计和规则相结合的中文机构名称识别[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
【二级引证文献】
中国期刊全文数据库 前8条
1 高红;黄德根;杨元生;;汉语自动分词中中文地名识别[J];大连理工大学学报;2006年04期
2 刘群,张华平,俞鸿魁,程学旗;基于层叠隐马模型的汉语词法分析[J];计算机研究与发展;2004年08期
3 余祖波;高庆狮;方淼;;中文姓名自动识别系统的设计与实现[J];计算机工程与应用;2006年10期
4 毋琳;郑逢斌;乔保军;汤赛丽;;HENU汉语分词系统中的中文人名识别算法[J];计算机工程与应用;2006年14期
5 周波;杨国纬;;基于贝叶斯算法的中国人名识别[J];计算机应用;2006年04期
6 李中国;刘颖;;边界模板和局部统计相结合的中国人名识别[J];中文信息学报;2006年05期
7 俞鸿魁;张华平;刘群;吕学强;施水才;;基于层叠隐马尔可夫模型的中文命名实体识别[J];通信学报;2006年02期
8 高红;黄德根;杨元生;;中文文本中外国人名与中国人名同步识别方法[J];小型微型计算机系统;2006年04期
中国重要会议论文全文数据库 前7条
1 陈禹;史晓东;向晓雯;张润延;;基于混合方法的中文命名实体识别[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
2 俞鸿魁;张华平;刘群;吕学强;施水才;;基于层叠隐马尔可夫模型的中文命名实体识别[A];全国网络与信息安全技术研讨会'2005论文集(下册)[C];2005年
3 钱小飞;陈小荷;董宇;何晓丽;;面向大型叙事作品的指人成分识别[A];第三届学生计算语言学研讨会论文集[C];2006年
4 李治国;周俏丽;;在篇章中面向产品类的命名实体识别研究[A];第三届学生计算语言学研讨会论文集[C];2006年
5 郑家恒;谭红叶;王兴义;;基于模式匹配的中文专有名词识别[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
6 高嵩;周强;;一种中文分词后处理反馈算法[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
7 冯元勇;孙乐;张大鲲;李文波;;基于单字提示特征的中文命名实体识别快速算法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国博士学位论文全文数据库 前7条
1 余传明;基于本体的语义信息系统研究[D];武汉大学;2005年
2 于满泉;面向人物追踪的知识挖掘研究[D];中国科学院研究生院(计算技术研究所);2006年
3 张华平;语言浅层分析与句子级新信息检测研究[D];中国科学院研究生院(计算技术研究所);2005年
4 张素香;信息抽取中关键技术的研究[D];北京邮电大学;2007年
5 高红;基于统计语言模型的汉语浅层分析研究[D];大连理工大学;2007年
6 周顺先;文本信息抽取模型及算法研究[D];湖南大学;2007年
7 傅魁;基于Web的本体学习研究[D];武汉理工大学;2007年
中国硕士学位论文全文数据库 前10条
1 周波;汉语语言处理中专有名词的提取和识别[D];电子科技大学;2006年
2 张旭洁;基于语义网络的类自然语言的知识获取与转换的研究[D];云南师范大学;2006年
3 乔羽;基于最大熵模型的中文人名识别方法研究[D];山西大学;2005年
4 王兴义;基于模式匹配的中文专有名词识别[D];山西大学;2005年
5 王江伟;基于最大熵模型的中文命名实体识别[D];南京理工大学;2005年
6 熊冬明;汉语自动分词和中文人名识别技术研究[D];浙江大学;2006年
7 崔世起;中文新词检测与分析[D];中国科学院研究生院(计算技术研究所);2006年
8 王慧慧;基于自然语言处理的问答系统研究[D];电子科技大学;2006年
9 贺胜;面向现代汉语文本处理的全文检索、自动分词通用系统[D];南京师范大学;2006年
10 王蕾;基于转换学习的专有名词识别[D];苏州大学;2006年
【相似文献】
中国期刊全文数据库 前10条
1 杨军;;概率性优选论[J];当代语言学;2007年02期
2 姚从军;;互模拟在理论和实践中的应用[J];沈阳师范大学学报(社会科学版);2009年06期
3 申文明;刘连芳;黄家裕;温家凯;;基于概率模型的汉语和越南语的人名音译方法[J];广西科学院学报;2010年04期
4 刘志雅;;不同维度特征的共存对归类不确定性特征推理的影响[J];心理学报;2008年01期
5 张元收;葛宁宗;;几个数学恒等式的概率证明[J];数学教学研究;2008年05期
6 余嘉元;项目反应理论研究中的计算机模拟方法[J];心理科学;1991年02期
7 ;廖鼎烈教授参加第十六届国际混凝土及结构学术会议[J];石家庄铁道学院学报;1991年04期
8 罗冠中;;Rasch模型及其发展[J];教育研究与实验;1992年02期
9 刘霞,潘晓良;关于不确定性问题解决的研究[J];湖北大学学报(哲学社会科学版);1995年04期
10 马剑虹;GUTTMAN量表的概率模型及其发展[J];心理发展与教育;1997年04期
中国重要会议论文全文数据库 前10条
1 季姮;罗振声;;基于反比概率模型和规则的中文姓名自动辨识系统[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 张少华;言茂松;;抽水蓄能电站调峰效益的经济评价[A];1995中国控制与决策学术年会论文集[C];1995年
3 王世忠;;公路桥梁恒载的概率模型[A];全国桥梁结构学术大会论文集(上册)[C];1992年
4 段权;;压力容器用16MnR钢焊接接头疲劳裂纹扩展规律的研究[A];疲劳与断裂2000——第十届全国疲劳与断裂学术会议论文集[C];2000年
5 王冰洁; 沈玉清;;中国上市公司被收购风险概率模型的实证分析[A];中国灾害防御协会风险分析专业委员会第二届年会论文集(一)[C];2006年
6 谢柏桥;戴光明;郑蔚;王剑文;;有指导的多目标演化算法在区域星座设计中的应用[A];中国宇航学会深空探测技术专业委员会第四届学术年会论文集[C];2007年
7 陈学前;肖世富;刘信恩;;基于概率模型的圣地亚结构动力学问题模型确认[A];中国计算力学大会'2010(CCCM2010)暨第八届南方计算力学学术会议(SCCM8)论文集[C];2010年
8 李俊薇;杨青;张连发;黄宇颖;;基于贝叶斯定理的个性化体检网站的研究[A];第二十三届中国(天津)2009IT、网络、信息技术、电子、仪器仪表创新学术会议论文集[C];2009年
9 马治飞;徐望;王炳锡;王兴斌;;一种基于概率模型和倒谱差分的特征补偿算法[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
10 那键;刘文芬;;乘加型钟控组合生成器的符合率问题[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
中国重要报纸全文数据库 前10条
1 李必德(Peter Zimmerli);亚洲台风模型需要精益求精[N];中国保险报;2006年
2 万云;以信用风险管理的名义[N];中国经营报;2006年
3 清华大学计算机系智能技术与系统国家重点实验室 张敏 金奕江;寻“宝”有术[N];计算机世界;2003年
4 张宗新朱伟骅;防范公司管理层利用重大事件侵害外部投资者[N];中国证券报;2007年
5 程实;世界杯,如何影响全球股市[N];第一财经日报;2006年
6 赵应繁;湖北网上发布地灾气象预警预报[N];地质勘查导报;2006年
7 ;从激情到理性[N];经济视点报;2006年
8 记者郭均忠;结构可靠度理论为桥梁护驾[N];中国交通报;2002年
9 王一琳 夏峰 王立伟;亚太区银行离巴塞尔Ⅱ很远[N];东方早报;2005年
10 见依;学会用计量经济学研究人力资本[N];北京人才市场报;2003年
中国博士学位论文全文数据库 前10条
1 刘扬;混凝土斜拉桥施工期的时变可靠性研究[D];湖南大学;2005年
2 李富民;氯盐环境钢绞线预应力混凝土结构的腐蚀效应[D];中国矿业大学;2008年
3 黄晓英;钟控生成器概率模型输出序列的性质研究[D];中国人民解放军信息工程大学;2003年
4 吴晶晶;PKI关键理论与应用技术研究[D];中国科学技术大学;2008年
5 孙庆杰;静态图像中人体检测技术研究[D];中国科学院研究生院(软件研究所);2004年
6 郭丽峰;电梯导轨不平顺度测量、建模及轿箱水平振动特性的研究[D];天津大学;2005年
7 余怀忠;地震前兆物理模型与地震预测初步研究[D];中国地震局地质研究所;2006年
8 王慧琼;计算机视觉中的二分光问题研究[D];浙江大学;2008年
9 黄玉娟;基于k词的DNA序列分析的模型研究及应用[D];大连理工大学;2012年
10 沈照伟;基于可靠度的海洋工程随机荷载组合及设计方法研究[D];浙江大学;2004年
中国硕士学位论文全文数据库 前10条
1 蒋冬初;遗传算法及其在函数优化问题中的应用研究[D];湖南大学;2004年
2 柳群义;构皮滩水电站边坡岩体结构面概率模型与岩体质量分级研究及应用[D];中南大学;2005年
3 明永涛;泛广义自缩减生成器的设计与分析[D];解放军信息工程大学;2007年
4 赵欣庆;高中概率教学研究[D];西北师范大学;2005年
5 尹明霞;高中数学新课程概率教学研究[D];首都师范大学;2006年
6 谭龙远;基于领域的网络爬虫技术的研究与实现[D];武汉理工大学;2009年
7 贾玉祥;基于概率模型的名人网页相关度评价研究[D];郑州大学;2006年
8 张剑锋;规则与统计相结合的中文分词方法研究[D];山西大学;2008年
9 杨礼敏;高中数学概率统计教学复习策略研究[D];河北师范大学;2007年
10 陈智瑶;双重任务下条件推理概率模型与启发式系统融合的实证研究[D];江西师范大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026