期刊库|学位论文库|会议论文库|飞度BOOK|站内搜索注册|充值中心|购买知网卡|送卡上门|帮助中心|
全文文献: “飞度BOOK”首届期刊庙会开幕啦!
做个飞度客,万千杂志,想看就看!
《中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集》 2006年
加入收藏 获取最新

一种基于实例学习的人名识别方法

朱丽丽  郑家恒  
【摘要】:人名识别是自然语言处理领域的一个重要的子任务。实例学习是机器学习中的一种常见的方法。本文在对大量语料的语言现象的统计与分析的基础上,提出了一种用实例描述语言现象,用相似度计算识别人名的方法。实验表明, 该方法具有一定的可行性。
【作者单位】:山西大学计算机与信息技术学院 山西大学计算机与信息技术学院
【关键词】:人名识别 实例学习 相似度计算
【基金】:国家自然科学基金(60473139)项目 山西省自然科学基金(20051034)项目资助
【分类号】:TP391.43
【正文快照】:
1引言 专有名词识别是中文信息处理领域的一个重要子任务。根据我们对150万字人民日报语料统计 结果显示,人名占专有名词的35.7%。因此,人名识别技术的突破对于提高汉语分词的准确性以及 句法分析、信息抽取等后续的中文信息处理领域,具有很重要的作用。 目前,对于中文人
全文下载: CAJ格式 (推荐) PDF格式
不支持迅雷等加速下载工具,请取消加速工具后下载
CAJViewer7.0阅读器支持所有CNKI文件格式,AdobeReader仅支持PDF格式

【参考文献】
中国期刊全文数据库 前2条
1 余祖波;高庆狮;方淼;;中文姓名自动识别系统的设计与实现[J];计算机工程与应用;2006年10期
2 黄德根,杨元生,王省,张艳丽,钟万勰;基于统计方法的中文姓名识别[J];中文信息学报;2001年02期
【共引文献】
中国期刊全文数据库 前10条
1 张锋,樊孝忠;基于最大熵模型的交集型切分歧义消解[J];北京理工大学学报;2005年07期
2 黄德根,马玉霞,杨元生;基于互信息的中文姓名识别方法[J];大连理工大学学报;2004年05期
3 杜永萍,郑家恒;分词及词性标注一致性校对系统的设计与实现[J];电脑开发与应用;2001年10期
4 张辉,徐健;中国组织机构名自动识别系统的设计与实现[J];电脑开发与应用;2002年01期
5 王显芳,杜利民;一种能够检测所有交叉歧义的汉语分词算法[J];电子学报;2004年01期
6 王显芳,杜利民;利用覆盖歧义检测法和统计语言模型进行汉语自动分词[J];电子与信息学报;2003年09期
7 冯丽萍;;基于统计的中文组织机构名识别[J];福建电脑;2006年01期
8 谢春发;中文信息处理在智能答疑系统中的应用研究[J];福建广播电视大学学报;2005年02期
9 李朝虹,陆建湖;现代汉语自动分析研究现状综述[J];广西教育学院学报;2003年01期
10 黄维金;顾益军;赵勋平;;基于自然语言理解的Web敏感信息监控[J];中国人民公安大学学报(自然科学版);2006年01期
中国重要会议论文全文数据库 前10条
1 曾华琳;史晓东;李堂秋;;基于上下文信息提取的概率分词算法[A];第六届汉语词汇语义学研讨会论文集[C];2005年
2 靳光瑾;郭曙纶;肖航;章云帆;;语料库加工中的规范问题——谈《信息处理用现代汉语词类标记集规范》[A];语言文字应用研究论文集(Ⅱ)[C];2004年
3 张艳丽;黄德根;张丽静;杨元生;;统计和规则相结合的中文机构名称识别[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
4 马玉霞;黄德根;杨元生;;一种改进的中文姓名识别方法[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
5 朱江涛;赵丽奎;蔡东风;;基于最大熵模型的中文姓名识别方法初探[A];第二届全国学生计算语言学研讨会论文集[C];2004年
6 程月;季娜;洪鹿平;;基于语料统计的以“不”开头双字分词不一致研究[A];第三届学生计算语言学研讨会论文集[C];2006年
7 杜超华;沈威;姚双云;;基于复句语料库的分词系统的研究[A];第三届学生计算语言学研讨会论文集[C];2006年
8 吐尔根·依不拉音;阿里甫·库尔班;阿不都热依木;;基于词典的现代维吾尔语词性自动标注系统的研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
9 张霄军;董宇;陈小荷;;基于语料考察的“组合型歧义”与“切分变异”辨析[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
10 赫琳;;论“X 从小 Y”的词切分——“从小”语义指向计算机识别的再思考[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 张蕾;概念结构及其应用[D];西北工业大学;2001年
2 刘忠;性质语意理论的提出与自然语言理解及其实现的研究[D];华东师范大学;2004年
3 隋岩;基于“动态流通语料库”的“有效字符串”提取研究[D];北京语言大学;2004年
4 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
5 郑泽芝;基于动态流通语料库(DCC)的汉语字母词语识别及考察研究[D];北京语言大学;2005年
6 刘伟;现代汉语代词隐现的动态研究[D];北京语言大学;2005年
7 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
8 易勇;计算机辅助诗词创作中的风格辨析及联语应对研究[D];重庆大学;2005年
9 高红;基于统计语言模型的汉语浅层分析研究[D];大连理工大学;2007年
10 段建勇;多词表达抽取及其应用[D];上海交通大学;2007年
中国硕士学位论文全文数据库 前10条
1 罗智勇;现代汉语通用分词系统的技术与实现[D];北京工业大学;2002年
2 廉竹钧;汉语组合型切分歧义字段消歧方法研究[D];北京语言文化大学;2002年
3 张丽静;规则与统计相结合的兼类词处理机制[D];大连理工大学;2002年
4 章成志;基于文本层次模型的Web概念挖掘研究[D];南京农业大学;2002年
5 张艳丽;中文机构名称的自动识别[D];大连理工大学;2003年
6 许林杰;中文文本分词研究[D];山东师范大学;2003年
7 由丽萍;动词与动词搭配自动获取方法研究[D];上海师范大学;2003年
8 岑咏华;科技信息门户网站的技术研究[D];南京理工大学;2003年
9 刘军;基于论点倾向的网络信息内容实时分析研究[D];四川大学;2003年
10 李盛;面向真实文本的汉语词义排歧系统[D];山西大学;2003年
【二级参考文献】
中国期刊全文数据库 前7条
1 张仰森,徐波,曹元大,宗成庆;基于姓氏驱动的中国姓名自动识别方法[J];计算机工程与应用;2003年04期
2 张华平,刘群;基于角色标注的中国人名自动识别研究[J];计算机学报;2004年01期
3 黄德根,杨元生,王省,张艳丽,钟万勰;基于统计方法的中文姓名识别[J];中文信息学报;2001年02期
4 季姮,罗振声;基于统计和规则的中文姓名自动辨识[J];语言文字应用;2001年01期
5 付国宏,王晓龙;汉语词语边界自动划分的模型与算法[J];计算机研究与发展;1999年09期
6 吴胜远;一种汉语分词方法[J];计算机研究与发展;1996年04期
7 孙茂松,黄昌宁,高海燕,方捷;中文姓名的自动辨识[J];中文信息学报;1995年02期
【相似文献】
中国期刊全文数据库 前10条
1 金海东;《天马》的知识自动获取[J];计算机研究与发展;1991年10期
2 唐雁;邱玉辉;;实例学习与解释学习的结合[J];计算机科学;1992年02期
3 徐智晨,钱家骅;具有实例学习功能的增量逆句法分析器的设计[J];计算机工程;1993年03期
4 蒋学锋;张弘;;定罪量刑系统DZLX中不确定性知识的表示和处理[J];贵州大学学报(自然科学版);1993年03期
5 魏一鸣,童光煦,陈孝华;基于神经网络的矿山经济规模专家系统研究[J];江西有色金属;1994年04期
6 朱鳌鑫;L1语言中的知识库系统[J];计算机工程与设计;1995年03期
7 张晖 ,徐天祎 ,矫健;美国大学里的多媒体教学应用二例[J];多媒体世界;1995年08期
8 全如瑊;谈谈术语工作中的几个问题[J];术语标准化与信息技术;1996年01期
9 刘金琨,王树青;高炉专家系统知识的实例学习[J];控制理论与应用;1998年06期
10 李久永,普园媛,李学群,李天牧;一个基于神经网络的烤烟分级系统[J];云南大学学报(自然科学版);1998年S1期
中国重要会议论文全文数据库 前4条
1 刘金琨;侯伯岩;;高炉专家系统的自学习模型[A];1996中国控制与决策学术年会论文集[C];1996年
2 刘金琨;徐心和;苏士权;路萍;;高炉专家系统知识的实例学习[A];1997中国控制与决策学术年会论文集[C];1997年
3 王文凤;谢雅;张晓勇;;SBD策略在多智能体协作中的应用研究[A];2004中国机器人足球比赛暨学术研讨会论文集[C];2004年
4 朱丽丽;郑家恒;;一种基于实例学习的人名识别方法[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
中国重要报纸全文数据库 前1条
1 孝感市实验小学 娄爱萍;试谈口语交际的训练途径[N];孝感日报;2005年
中国硕士学位论文全文数据库 前7条
1 闫丽瑞;基于神经网络的自适应增益预测语音编码系统[D];太原理工大学;2003年
2 李东艳;互联网信息内容安全过滤方法研究[D];山西大学;2004年
3 林联明;径向基函数网络和实例学习在强化学习中的应用[D];合肥工业大学;2005年
4 崔保红;Ontology自动生成技术及应用[D];北京工业大学;2005年
5 杨健;房地产投资开发经验重用的TCBR实现研究[D];昆明理工大学;2005年
6 吴雪军;面向信息抽取的命名实体识别与模板获取技术研究[D];东北大学;2005年
7 梁奇;语言模型自适应方法在嵌入式系统中应用的研究[D];清华大学;2006年
关于知网|版权声明|学术会议服务|广告服务|在线咨询
京ICP证040431号互联网出版许可证新出网证(京)字008号北京市公安局海淀分局备案号:110 1081725
订购咨询热线:800-810-6613、010-62985026免费送卡上门
主办:清华大学
数字出版:中国学术期刊电子杂志社
在线发行:同方知网(北京)技术有限公司
关 闭
关 闭
关 闭