收藏本站
《第四届全国信息检索与内容安全学术会议论文集(上)》2008年
收藏 | 手机打开
二维码
手机客户端打开本文

基于统计信息的未登录词的扩展识别方法

韩艳  林煜熙  姚建民  
【摘要】:本文提出一种基于网络资源的未登录词的扩展识别方法。该方法以左右邻信息判断未登录词边界为基础对已识别出的二元候选未登录词种子进行扩展,从而得到不限长度的语义更完整的未登录词。实验证明本文方法可行有效。

手机知网App
【参考文献】
中国期刊全文数据库 前10条
1 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
2 贺敏;龚才春;张华平;程学旗;;一种基于大规模语料的新词识别方法[J];计算机工程与应用;2007年21期
3 贾自艳,史忠植;基于概率统计技术和规则方法的新词发现[J];计算机工程;2004年20期
4 周蕾;朱巧明;;基于统计和规则的未登录词识别方法研究[J];计算机工程;2007年08期
5 刘建舟,何婷婷,骆昌日;基于语料库和网络的新词自动识别[J];计算机应用;2004年07期
6 王立希;王建东;汪静;;基于数据挖掘的新词发现[J];计算机应用研究;2006年12期
7 吕雅娟,赵铁军,杨沐昀,于浩,李生;基于分解与动态规划策略的汉语未登录词识别[J];中文信息学报;2001年01期
8 刘华;;一种快速获取领域新词语的新方法[J];中文信息学报;2006年05期
9 方高林;于浩;孟遥;邹纲;;基于字单元分析的中文辅助阅读系统[J];中文信息学报;2008年02期
10 沈达阳,孙茂松;Internet中文个人信息搜索[J];中文信息学报;1999年02期
【共引文献】
中国期刊全文数据库 前10条
1 罗智勇;宋柔;;基于多特征的自适应新词识别[J];北京工业大学学报;2007年07期
2 马志强;周长胜;丁维;杨娜;;校园网搜索引擎的研究与实现[J];北京机械工业学院学报;2007年01期
3 李国和;刘光胜;吴卫江;孙红军;唐先明;韩宝东;;基于最大匹配和歧义检测的中文分词粗分方法[J];北京信息科技大学学报(自然科学版);2010年S2期
4 窦嵘;加羊吉;黄伟;;统计与规则相结合的藏文人名自动识别研究[J];长春工程学院学报(自然科学版);2010年02期
5 周蕾;;基于碎片分词的未登录词识别方法[J];常熟理工学院学报;2007年02期
6 曾华琳;周昌乐;郑旭玲;;A New Word Detection Method for Chinese Based on Local Context Information[J];Journal of Donghua University(English Edition);2010年02期
7 高红;黄德根;杨元生;;汉语自动分词中中文地名识别[J];大连理工大学学报;2006年04期
8 张利;张立勇;张晓淼;耿铁锁;岳宗阁;;基于改进BP网络的中文歧义字段分词方法研究[J];大连理工大学学报;2007年01期
9 王慧慧;;划分“11段”的思想在文本处理方面的研究[J];电脑知识与技术;2009年30期
10 王波;;基于领域语料的专业英语教学词汇建构[J];电脑知识与技术;2011年13期
中国重要会议论文全文数据库 前10条
1 贾会强;刘晓丽;于洪志;;基于词性特征提取的藏文文本分类方法研究[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年
2 吴悦;燕鹏举;翟鲁峰;;一种基于二元背景模型的新词发现方法[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
3 吴悦;燕鹏举;翟鲁峰;;基于二元背景模型的新词发现[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年
4 周蕾;李培峰;朱巧明;杨季文;;碎片分词与词结合提取的未登录词识别方法[A];第六届汉语词汇语义学研讨会论文集[C];2005年
5 王慧慧;杨国纬;;基于事例的问答系统研究[A];贵州制约逻辑学会2005年学术年会暨首届全国性逻辑系统专题研讨会论文集[C];2005年
6 陈晓;;中文文本自动分词研究述要[A];第四届全国语言文字应用学术研讨会论文集[C];2005年
7 邹纲;刘洋;刘群;孟遥;于浩;西野文人;亢世勇;;面向Internet的中文新词语检测[A];2004年辞书与数字化研讨会论文集[C];2004年
8 俞鸿魁;张华平;刘群;吕学强;施水才;;基于层叠隐马尔可夫模型的中文命名实体识别[A];全国网络与信息安全技术研讨会'2005论文集(下册)[C];2005年
9 邓攀;刘功申;;基于标引信息的网络新概念发现算法[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年
10 龚才春;贺敏;张华平;许洪波;程学旗;;大规模语料的频繁模式快速发现算法[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年
中国博士学位论文全文数据库 前10条
1 张海军;基于大规模语料的中文新词识别技术研究[D];中国科学技术大学;2011年
2 杨抒;基于WEB的林产品信息资源整合方法研究[D];北京林业大学;2011年
3 黄水清;非相关文献知识发现方法及在农业经济学中的应用[D];南京农业大学;2010年
4 张智雄;Internet科技信息资源门户网站(STIP)系统的实践研究[D];中国科学院文献情报中心;2000年
5 王强军;基于动态流通语料库(DCC)的信息技术领域新术语自动提取研究[D];北京语言文化大学;2003年
6 隋岩;基于“动态流通语料库”的“有效字符串”提取研究[D];北京语言大学;2004年
7 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
8 杨建国;基于动态流通语料库(DCC)的汉语熟语单位研究[D];北京语言大学;2005年
9 赵章界;短语结构制导的范畴表达式演算[D];中国科学院研究生院(计算技术研究所);2006年
10 曹海龙;基于词汇化统计模型的汉语句法分析研究[D];哈尔滨工业大学;2006年
中国硕士学位论文全文数据库 前10条
1 廖文平;基于CRF的中文地名识别研究[D];大连理工大学;2010年
2 胡志敏;互联网文本自动文摘技术的研究[D];湘潭大学;2010年
3 江涛;基于藏文web舆情分析的热点发现算法研究[D];西北民族大学;2010年
4 杨鼎;基于朴素贝叶斯的中文文本情感倾向分类研究[D];湖南工业大学;2010年
5 史迎馨;建筑图中有限自然语言的分析与理解的研究[D];长春工业大学;2010年
6 李丹;基于规则与统计的汉语自动分词研究[D];长春工业大学;2010年
7 吕靖;互联网搜索词分类关键技术研究[D];浙江大学;2011年
8 梁桢;基于尾字词典的逆向回溯中文分词技术研究[D];武汉工业学院;2010年
9 王林平;基于内容的电子邮件过滤系统的研究[D];电子科技大学;2010年
10 蔡蕊;一种新的搜索引擎分词词典的研究[D];山东大学;2010年
【二级参考文献】
中国期刊全文数据库 前3条
1 孙茂松,左正平,黄昌宁;消解中文三字长交集型分词歧义的算法[J];清华大学学报(自然科学版);1999年05期
2 张辉,薛贵荣;基于文本挖掘的搭配词典自动架构探讨[J];上海工程技术大学学报;2004年04期
3 陈玉泉,顾顺莲,陆汝占;计算机辅助新词新语词典的编纂[J];上海交通大学学报;2000年07期
中国重要会议论文全文数据库 前1条
1 朱凯;周杰;何婷婷;;因特网语料自动下载分析软件的设计[A];第一届学生计算语言学研讨会论文集[C];2002年
中国博士学位论文全文数据库 前2条
1 隋岩;基于“动态流通语料库”的“有效字符串”提取研究[D];北京语言大学;2004年
2 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
【相似文献】
中国期刊全文数据库 前10条
1 傅爱平;汉语信息处理中单字的构词方式与合成词的识别和理解[J];语言文字应用;2003年04期
2 肖航;第41届国际计算语言联合会在日本召开[J];语言文字应用;2003年03期
3 宇信;语言学科“九五”重大课题《信息处理用现代汉语词汇研究》启动[J];语文建设;1997年10期
4 冯志伟;汉语书面语的分词连写[J];语文建设;2001年03期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 韩艳;林煜熙;姚建民;;基于统计信息的未登录词的扩展识别方法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
2 雷静;张舵;冯霞;;基于构成模式的汉语机构名识别[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
3 何燕;;基于单字词转移概率的未登录词识别[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
4 周蕾;李培峰;朱巧明;杨季文;;碎片分词与词结合提取的未登录词识别方法[A];第六届汉语词汇语义学研讨会论文集[C];2005年
5 陈晓;靳光瑾;黄昌宁;;基于字的分词方法的实验研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
6 谢俊英;;新词语发现手段和新词语词典编纂浅谈[A];第五届全国语言文字应用学术研讨会论文集[C];2007年
7 肖航;靳光瑾;;现代汉语词语切分歧义库构建[A];第三届全国语言文字应用学术研讨会论文集[C];2004年
8 陈丽江;;ACL-SIGHAN第一届国际中文分词竞赛评述[A];第二届全国学生计算语言学研讨会论文集[C];2004年
9 王思力;王斌;;基于双字耦合度的中文分词交叉歧义处理方法[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
10 斯·劳格劳;华沙宝;萨如拉;;基于NFA的蒙古语词法分析算法研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
中国博士学位论文全文数据库 前1条
1 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
中国硕士学位论文全文数据库 前1条
1 羊毛卓么;藏文词性自动标注系统的研究与实现[D];西藏大学;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026