收藏本站
《NCIRCS2004第一届全国信息检索与内容安全学术会议论文集》2004年
收藏 | 手机打开
二维码
手机客户端打开本文

基于语料库的字母词语自动提取研究

郑泽之  张普  杨建国  
【摘要】:本文分析了字母词语的组成情况的复杂特征和自动识别的难点,结合字母词语的各种统计特征,提出了规则加统计辅助的字母词语自动提取的算法。算法简单,但有效。召回率为100%,准确率在80%以上。

手机知网App
【参考文献】
中国期刊全文数据库 前4条
1 刘秉伟,黄萱菁,郭以昆,吴立德;基于统计方法的中文姓名识别[J];中文信息学报;2000年03期
2 孙茂松,黄昌宁,高海燕,方捷;中文姓名的自动辨识[J];中文信息学报;1995年02期
3 刘涌泉;关于汉语字母词的问题[J];语言文字应用;2002年01期
4 郑家恒,李鑫,谭红叶;基于语料库的中文姓名识别方法研究[J];中文信息学报;2000年01期
【共引文献】
中国期刊全文数据库 前10条
1 原新梅;字母词语的表达功效[J];修辞学习;2002年06期
2 原新梅;;字母词的收入与注音问题[J];辞书研究;2005年04期
3 余桂林;;关于字母词的几个问题——兼评两本字母词词典[J];辞书研究;2006年03期
4 黄昌宁,孙茂松;中文信息处理最新成果的检阅——记新加坡中文电脑国际会议ICCC’96[J];当代语言学;1996年04期
5 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
6 黄德根,马玉霞,杨元生;基于互信息的中文姓名识别方法[J];大连理工大学学报;2004年05期
7 刘利东;基于组合度的汉语分词决策算法研究[J];德州学院学报;2003年02期
8 马颖华,王永成,苏贵洋;一种在汉语文本中抽取重复字串的快速算法[J];电子学报;2002年S1期
9 王显芳,杜利民;一种能够检测所有交叉歧义的汉语分词算法[J];电子学报;2004年01期
10 李建华,王晓龙;中文人名自动识别的一种有效方法[J];高技术通讯;2000年02期
中国重要会议论文全文数据库 前10条
1 周红红;;文化特色词与双语词典[A];中国辞书学会双语词典专业委员会第6届年会暨学术研讨会论文专辑[C];2005年
2 余锋;;外来语与汉语引进外来语的方式探讨[A];福建省首届外事翻译研讨会论文集[C];2007年
3 余锋;;外来语与汉语引进外来语的方式探讨[A];福建省外国语文学会2005年年会暨学术研讨会论文集[C];2005年
4 郑泽之;张普;;关于字母词语的几点思考[A];第六届汉语词汇语义学研讨会论文集[C];2005年
5 周蕾;李培峰;朱巧明;杨季文;;碎片分词与词结合提取的未登录词识别方法[A];第六届汉语词汇语义学研讨会论文集[C];2005年
6 王崇;;字母词问题综述[A];语言学论文选集[C];2001年
7 侯敏;侯敞;;汉英机译系统译文质量的评测[A];世纪之交的中国应用语言学研究——第二届全国语言文字应用学术研讨会论文集[C];1998年
8 原新梅;;字母词语在不同语体中的运用[A];第三届全国语言文字应用学术研讨会论文集[C];2004年
9 陆亚莹;;汉语表达中的新变化——论中英文夹杂现象[A];语言学新思维[C];2004年
10 罗春宏;;网络新词语“PK”词义探析[A];江西省语言学会2005年年会论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 郑泽芝;基于动态流通语料库(DCC)的汉语字母词语识别及考察研究[D];北京语言大学;2005年
2 刘忠;性质语意理论的提出与自然语言理解及其实现的研究[D];华东师范大学;2004年
3 隋岩;基于“动态流通语料库”的“有效字符串”提取研究[D];北京语言大学;2004年
4 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
5 杨建国;基于动态流通语料库(DCC)的汉语熟语单位研究[D];北京语言大学;2005年
6 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
7 李晓光;XML非完全结构查询处理中若干关键技术的研究[D];东北大学;2006年
8 李彦洁;现代汉语外来词发展研究[D];山东大学;2006年
9 张素香;信息抽取中关键技术的研究[D];北京邮电大学;2007年
10 周启强;英汉构词法的认知研究[D];湖南师范大学;2007年
中国硕士学位论文全文数据库 前10条
1 袁园;1990-2002年间的经济类新词透析[D];南京师范大学;2006年
2 胡业江;中文姓名自动识别技术研究[D];华侨大学;2005年
3 朱珣;中文自动分词系统的研究[D];华中师范大学;2004年
4 何燕;任意类型的未登录词的识别研究[D];北京语言文化大学;2000年
5 王省;基地统计和规则的中文姓名识别系统的研制[D];大连理工大学;2000年
6 李卫亮;现代汉语分词系统中专名识别的实用策略[D];北京工业大学;2000年
7 吴雪敏;汉语语句的计算机分析[D];电子科技大学;2001年
8 许勇;基于百科词典的知识获取系统的研究与实现[D];北京工业大学;2001年
9 罗智勇;现代汉语通用分词系统的技术与实现[D];北京工业大学;2002年
10 章成志;基于文本层次模型的Web概念挖掘研究[D];南京农业大学;2002年
【同被引文献】
中国期刊全文数据库 前10条
1 原新梅;;字母词的收入与注音问题[J];辞书研究;2005年04期
2 吴登堂;关于字母词的思考——兼谈中文信息处理对字母词自动切分的构想[J];丹东师专学报;2003年02期
3 郭伏良;字母词与词典二题[J];河北大学学报(哲学社会科学版);1997年02期
4 赵玉英;网络语言与语言的经济性[J];外语电化教学;2003年06期
5 顾嘉祖;;谜米学:20世纪末文化学与语言学理论体系的重大突破[J];外语与外语教学;2007年01期
6 皇甫素飞;从《文汇报》看汉语字母词的历史演变[J];修辞学习;2004年05期
7 李敏;;从“N”看汉语里的另一种字母词[J];修辞学习;2006年02期
8 何自然,何雪林;模因论与社会语用[J];现代外语;2003年02期
9 谢朝群;何自然;;语言模因说略[J];现代外语;2007年01期
10 肖宁;;体育新闻中字母词的使用与规范[J];新闻爱好者;2006年07期
中国硕士学位论文全文数据库 前2条
1 黄鹂;汉语中英语借词的新趋势及规范化[D];西南大学;2006年
2 樊友新;历时视野里的字母词及其研究新视角[D];华东师范大学;2007年
【二级参考文献】
中国期刊全文数据库 前2条
1 沈孟璎;浅议字母词的入典问题[J];辞书研究;2001年01期
2 孙茂松,黄昌宁,高海燕,方捷;中文姓名的自动辨识[J];中文信息学报;1995年02期
【相似文献】
中国重要会议论文全文数据库 前8条
1 郑泽之;张普;杨建国;;基于语料库的字母词语自动提取研究[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
2 郝向阳;;地图信息识别与提取技术[A];西部大开发 科教先行与可持续发展——中国科协2000年学术年会文集[C];2000年
3 郑泽之;张普;;关于字母词语的几点思考[A];第六届汉语词汇语义学研讨会论文集[C];2005年
4 翟辉琴;雷蓉;董北平;;高空间分辨率遥感信息的自动提取技术[A];中国测绘学会九届三次理事会暨2007年“信息化测绘论坛”学术年会论文集[C];2007年
5 宋治平;武安绪;王梅;耿杰;罗桂安;;小波分析在数字化前兆观测资料中的应用[A];新方法和新技术在地震预报中的应用暨中国东部地区震情研讨会论文摘要集[C];2004年
6 董光波;孙增圻;谢桂海;马健;;核磁共振波谱分析与癌症特征提取技术研究[A];2005年中国智能自动化会议论文集[C];2005年
7 李广瑜;;当前汉语国际化的机遇、挑战及对策[A];语文现代化论丛(第八辑)[C];2008年
8 亢世勇;姜仁涛;姜岚;李艳;;《汉语新词语学习词典》的编纂[A];语文现代化论丛(第七辑)[C];2006年
中国博士学位论文全文数据库 前1条
1 王思远;基于地理时空数据库的中国近期土地利用/土地覆盖变化研究[D];中国科学院研究生院(遥感应用研究所);2002年
中国硕士学位论文全文数据库 前10条
1 李贺;服饰期刊中的字母词语研究[D];辽宁师范大学;2011年
2 邓世平;现代汉语字母词语的多角度研究[D];南京林业大学;2011年
3 纪飞;汉语字母词语规范问题研究[D];沈阳师范大学;2007年
4 左航;测井曲线的自动识别与提取[D];四川大学;2003年
5 苏珊娜;基于三个平面的网络字母词语研究[D];辽宁师范大学;2007年
6 裴昕月;广告标题中的字母词语研究[D];辽宁师范大学;2008年
7 韩志刚;基于特征提取的汽车零件CAPP技术研究[D];南京理工大学;2003年
8 焦卫东;空间网架螺栓节点球数控加工过程中自动分度优化研究[D];甘肃工业大学;2001年
9 樊琨;电子地图中地理对象的识别研究[D];大连理工大学;2003年
10 吴希斌;网络新闻标题语言调查分析[D];沈阳师范大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026