收藏本站
《第四届全国学生计算语言学研讨会会议论文集》2008年
收藏 | 手机打开
二维码
手机客户端打开本文

统计与语义相融合的词语相似度计算

郭丽  蔡东风  季铎  白宇  
【摘要】:词语相似度计算是自然语言处理领域的基础和研究难点。本文利用知网的相关概念场,将词语的相关性引入到基于平均互信息的词语相似度计算中,并提出了统计和语义相结合的词语相似度计算方法,采用了国家公务员考试"词语替换"题型进行测试,实验结果显示,准确率为0.65。
【作者单位】:沈阳航空工业学院知识工程中心
【分类号】:TP391.1

手机知网App
【参考文献】
中国期刊全文数据库 前1条
1 赵军;金千里;徐波;;面向文本检索的语义计算[J];计算机学报;2005年12期
中国重要会议论文全文数据库 前1条
1 关毅;王晓龙;;基于统计的汉语词汇间语义相似度计算[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
【共引文献】
中国期刊全文数据库 前4条
1 田久乐;赵蔚;;基于同义词词林的词语相似度计算方法[J];吉林大学学报(信息科学版);2010年06期
2 阎萍;邱修峰;;C语言中符号串相似度的计算方法[J];福建电脑;2009年03期
3 王磊;黄广君;;结合概念语义空间的语义扩展技术研究[J];计算机工程与应用;2012年35期
4 秦春秀;赵捧未;刘怀亮;;词语相似度计算研究[J];情报理论与实践;2007年01期
中国重要会议论文全文数据库 前3条
1 颜伟;荀恩东;;基于WordNet的英语词语相似度计算[A];第二届全国学生计算语言学研讨会论文集[C];2004年
2 丁凡;王斌;白硕;刘宜轩;李亚楠;;文本检索中句法信息的有效利用研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
3 龙丽霞;李蕾;钟义信;;一种基于实例语境的汉语语音识别后文本检错纠错方法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
中国博士学位论文全文数据库 前9条
1 郭鸿志;多源语义知识库融合方法研究[D];哈尔滨工业大学;2011年
2 王树梅;信息检索相关技术研究[D];南京理工大学;2007年
3 吕天阳;三维模型检索中基于聚类与基于语义方法的研究[D];吉林大学;2007年
4 马晖男;信息检索中浅层语义模型的研究[D];大连理工大学;2007年
5 李志国;面向分布式文本知识管理的中文分词与文本分类研究[D];重庆大学;2008年
6 夏亚梅;动态服务组合中的若干关键技术研究[D];北京邮电大学;2009年
7 刘兴林;中文词汇知识获取算法和语义计算研究及应用[D];华南理工大学;2012年
8 平源;基于支持向量机的聚类及文本分类研究[D];北京邮电大学;2012年
9 王秀红;文本相似度计算核函数的构造及其在分布式信息检索中的应用研究[D];江苏大学;2012年
中国硕士学位论文全文数据库 前10条
1 范丹;Web检索中的查询扩展及结果聚类技术研究[D];辽宁师范大学;2010年
2 丛肖为;敏感信息监管系统的设计与实现[D];华东师范大学;2010年
3 吴惠雄;基于支持向量机与聚类算法的中文文本分类研究[D];中南林业科技大学;2009年
4 石安磊;基于文本相似度评分的中医案例分析系统研究与实现[D];西北大学;2011年
5 刘海涛;基于自然语言理解的中文搜索引擎[D];河北科技大学;2011年
6 宋宇轩;基于搜索日志和点击日志的同义词挖掘的研究和实现[D];北京交通大学;2011年
7 吴全娥;汉语句子相似度计算及其在自动问答系统中的应用[D];西南大学;2011年
8 马中杰;基于领域本体的语义检索系统研究[D];安徽大学;2011年
9 张书娟;基于电子商务用户行为的同义词识别[D];哈尔滨工业大学;2011年
10 赵倩倩;维吾尔语信息检索[D];天津大学;2012年
【二级参考文献】
中国重要会议论文全文数据库 前2条
1 白硕;程学旗;郭莉;王斌;余智华;刘群;;大规模内容计算[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 金千里;赵军;徐波;;弱指导的统计隐含语义分析及其在跨语言信息检索中的应用[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
【相似文献】
中国期刊全文数据库 前10条
1 蒋溢;丁优;熊安萍;王化晶;;一种基于知网的词汇语义相似度改进计算方法[J];重庆邮电大学学报(自然科学版);2009年04期
2 张振幸;李金厚;;一种基于义原重合度的词语相似度计算[J];信阳师范学院学报(自然科学版);2010年02期
3 张亮;尹存燕;陈家骏;;基于语义树的中文词语相似度计算与分析[J];中文信息学报;2010年06期
4 刘建舟;刘晓华;;主观题自动批改技术的研究[J];湖北工业大学学报;2006年04期
5 葛斌;李芳芳;郭丝路;汤大权;;基于知网的词汇语义相似度计算方法研究[J];计算机应用研究;2010年09期
6 周粉;夏幼明;;一种改进的基于知网的语义相似度计算方法[J];云南大学学报(自然科学版);2008年S2期
7 张琳;胡杰;;FAQ问答系统句子相似度计算[J];郑州大学学报(理学版);2010年01期
8 高升,徐志明;统计语言模型中词的自动聚类技术研究[J];计算机工程与应用;2003年11期
9 郭燕慧,钟义信;统计语言模型中句子的语义连贯性判别[J];情报学报;2003年04期
10 赵正文;康耀红;;统计语言模型在信息检索中的应用[J];计算机工程与应用;2006年36期
中国重要会议论文全文数据库 前10条
1 郭丽;蔡东风;季铎;白宇;;统计与语义相融合的词语相似度计算[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
2 乔林;黄维通;孟威;;一种改进的知网系统词语相似度计算方法[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
3 张亮;尹存燕;陈家骏;;基于语义树的中文词语相似度计算与分析[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
4 白宇;于水;叶娜;蔡东风;任晓娜;;一种基于语境的词语相似度计算方法[A];第五届全国信息检索学术会议论文集[C];2009年
5 袁里驰;钟义信;;统计语言模型在语言信息处理中的应用[A];中国自动化学会、中国仪器仪表学会2004年西南三省一市自动化与仪器仪表学术年会论文集[C];2004年
6 郝长伶;董强;;知网知识库描述语言[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
7 董强;董振东;;基于知网的相关概念场的构建[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
8 白宇;蔡东风;赵环宇;季铎;;基于语义计算的中文相似问句抽取[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
9 杨尔弘;米丽萍;郝秀兰;;基于《知网》的词义排岐方法[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
10 袁里驰;钟义信;;一种新颖的词聚类算法[A];中国自动化学会、中国仪器仪表学会2004年西南三省一市自动化与仪器仪表学术年会论文集[C];2004年
中国重要报纸全文数据库 前10条
1 高向东;千家数字图书馆对接“中国知网”数字出版平台[N];山西日报;2007年
2 陈磊;“中国知网”数字出版平台及数字图书馆建馆系统启动[N];科技日报;2007年
3 李蒙生;数据管理年会落下帷幕 同方知网软件喜获殊荣[N];中国电脑教育报;2007年
4 张驰;发改委启动金宏工程清华同方知网担负研发重任[N];中国高新技术产业导报;2007年
5 记者 陈香;清华同方将推个人“知识超市”服务[N];中华读书报;2007年
6 冯文礼;创新业态 加快向数字出版转型[N];中国新闻出版报;2008年
7 张翠侠;优化教学模式 改变学习方式[N];中国图书商报;2006年
8 ;革历史数据的命[N];计算机世界;2004年
9 早报记者 陈斯斯 实习生 周雅涵;毕业临近论文检测软件热卖[N];东方早报;2011年
10 本报记者;山西科普惠农数字图书馆开通[N];山西日报;2011年
中国博士学位论文全文数据库 前10条
1 文娟;统计语言模型的研究与应用[D];北京邮电大学;2010年
2 刘政怡;中文整句智能输入方法研究[D];安徽大学;2007年
3 高红;基于统计语言模型的汉语浅层分析研究[D];大连理工大学;2007年
4 徐剑波;基于本体的电子政务资源管理系统研究[D];东华大学;2007年
5 田萱;基于上下文的信息检索关键技术研究[D];中国人民大学;2007年
6 姜维;统计中文词法分析及其强化学习机制的研究[D];哈尔滨工业大学;2007年
7 马瑞;非限制手写字符分割中相关技术与算法的研究[D];南京理工大学;2007年
8 吴应良;网络计算中的智能信息处理方法研究[D];华南理工大学;2000年
9 陈博;WEB文本情感分类中关键问题的研究[D];北京邮电大学;2008年
10 杨晓晖;软件行为动态可信理论模型研究[D];中国科学技术大学;2010年
中国硕士学位论文全文数据库 前10条
1 郭丽;基于上下文的词语相似度计算及其应用[D];沈阳航空工业学院;2009年
2 王萌;基于概念向量空间模型的中文自动文摘研究[D];华中师范大学;2005年
3 张静静;基于知网文本相似度的文摘自动评测方法研究[D];中国石油大学;2011年
4 孙继明;基于知网的汉语词义消歧研究[D];国防科学技术大学;2007年
5 柴晓丽;自动文摘技术的研究与应用[D];长春理工大学;2007年
6 苗雪雷;基于条件随机场的汉语词义消歧方法研究[D];沈阳航空工业学院;2007年
7 周美希;汉语语句组块及消歧的研究与实现[D];电子科技大学;2005年
8 卢冶;基于概念扩充和综合评价的中文自动文摘研究[D];大连理工大学;2006年
9 唐琦;基于语义分析的句子相似度计算研究[D];华北电力大学(北京);2009年
10 徐瑞;一个中文语义语料库的研究与建设[D];苏州大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026