收藏本站
《2008'中国信息技术与应用学术论坛论文集(一)》2008年
收藏 | 手机打开
二维码
手机客户端打开本文

汉语语句语义相似度的计算方法

李月雷  师瑞峰  林丽冰  周一民  
【摘要】:在中文信息处理中,汉语语句的语义相似度计算是一项基础而又重要的工作。本文首先利用《同义词词林》中"意原"的树状层次结构,得到"意原"间的相似度,再通过"意原"间的相似度计算出词语的语义相似度,进而利用词语间的相似度得到语句间的语义相似度。本文通过计算多个语句对的相似度来对方法的有效性进行了验证。研究结果表明,本文的方法能简单地、有效地计算出语句间的语义相似度。

【参考文献】
中国期刊全文数据库 前2条
1 李峰;李芳;;中文词语语义相似度计算——基于《知网》2000[J];中文信息学报;2007年03期
2 李素建;基于语义计算的语句相关度研究[J];计算机工程与应用;2002年07期
中国博士学位论文全文数据库 前1条
1 王斌;汉英双语语料库自动对齐研究[D];中国科学院研究生院(计算技术研究所);1999年
【共引文献】
中国期刊全文数据库 前10条
1 许云,樊孝忠,张锋;基于知网的语义相关度计算[J];北京理工大学学报;2005年05期
2 张俐,李晶皎,胡明涵,姚天顺;中文WordNet的研究及实现[J];东北大学学报(自然科学版);2003年04期
3 金博,史彦军,滕弘飞;基于语义理解的文本相似度算法[J];大连理工大学学报;2005年02期
4 刘亚军,徐易;一种基于加权语义相似度模型的自动问答系统[J];东南大学学报(自然科学版);2004年05期
5 卢志茂;刘挺;李生;;统计词义消歧的研究进展[J];电子学报;2006年02期
6 李建华,王晓龙;中文人名自动识别的一种有效方法[J];高技术通讯;2000年02期
7 程莉,卢正鼎,文坤梅,李娟;基于语义的模糊匹配探索与应用[J];华中科技大学学报(自然科学版);2003年02期
8 赵岩;王晓龙;刘秉权;关毅;;融合聚类触发对特征的最大熵词性标注模型[J];计算机研究与发展;2006年02期
9 郭池 ,陈家骏 ,王启祥;一种基于语料库的词义消歧策略[J];计算机工程与应用;2003年35期
10 高思丹,袁春风;语句相似度计算在主观题自动批改技术中的初步应用[J];计算机工程与应用;2004年14期
中国重要会议论文全文数据库 前9条
1 徐海;;英、汉分类词典编纂刍议[A];中国辞书学会双语词典专业委员会第四届年会暨学术研讨会论文集[C];2001年
2 朱莉;孟遥;赵铁军;李生;;英语句子边界的识别[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
3 余晓峰;刘鹏远;赵铁军;;一种基于《知网》的汉语词语词义消歧方法[A];第二届全国学生计算语言学研讨会论文集[C];2004年
4 杨建;杨沐昀;于浩;时晓升;;面向译文质量的EBMT系统实例库优化研究[A];第二届全国学生计算语言学研讨会论文集[C];2004年
5 马永腾;亢世勇;;新编同义词词林语义分类体系[A];第三届学生计算语言学研讨会论文集[C];2006年
6 马永腾;亢世勇;;非典型成员的语义标注策略和问题[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
7 路斌;万小军;杨建武;陈晓鸥;;基于同义词词林的词汇褒贬计算[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
8 王红玲;吕强;徐瑞;周国栋;;基于知识的语义相关度计算模型(英文)[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
9 王红玲;吕强;徐瑞;;一种基于知网的中文语义相关度计算模型[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 齐璇;汉语语义知识的表示及其在汉英机译中的应用[D];国防科学技术大学;2002年
2 马红妹;汉英机器翻译中汉语上下文语境的表示与应用研究[D];中国人民解放军国防科学技术大学;2002年
3 吴健;基于Web服务的网络化产品配置技术研究[D];浙江大学;2004年
4 余卫宇;几种图像结构语义模型和图像[D];华南理工大学;2005年
5 付相君;基于本体和Semantic Web技术的产品知识集成基础研究[D];浙江大学;2005年
6 曹海龙;基于词汇化统计模型的汉语句法分析研究[D];哈尔滨工业大学;2006年
7 李晓黎;WEB信息检索与分类中的数据采掘研究[D];中国科学院研究生院(计算技术研究所);2001年
8 何琳;古农学本体的半自动构建及检索研究[D];南京农业大学;2007年
9 武斌;面向俄文信息处理的机器翻译实验研究[D];中国人民解放军外国语学院;2007年
10 傅魁;基于Web的本体学习研究[D];武汉理工大学;2007年
中国硕士学位论文全文数据库 前10条
1 江森卓;现代汉语上下关系时间词语[D];华东师范大学;2004年
2 余刚;基于语义概念的文本特征描述[D];重庆大学;2005年
3 卢冶;基于概念扩充和综合评价的中文自动文摘研究[D];大连理工大学;2006年
4 张学;EBMT系统中翻译模板的抽取与匹配[D];大连理工大学;2006年
5 陈檀;基于本体的网上答疑系统的设计[D];山东大学;2005年
6 张艳;面向高校师生的应用文机辅写作关键技术研究[D];大连理工大学;2006年
7 王慧慧;基于自然语言处理的问答系统研究[D];电子科技大学;2006年
8 曲晓;受限条件下学生作业文本相似度的研究[D];内蒙古师范大学;2006年
9 安利斌;基于知网的内容知晓研究[D];太原理工大学;2006年
10 徐瑞;一个中文语义语料库的研究与建设[D];苏州大学;2006年
【二级参考文献】
中国期刊全文数据库 前1条
1 吴健,吴朝晖,李莹,邓水光;基于本体论和词汇语义相似度的Web服务发现[J];计算机学报;2005年04期
【相似文献】
中国期刊全文数据库 前10条
1 曾诚;韩光辉;李兵;朱子龙;;一种改进的基于路径的语义相似度计算算法[J];微电子学与计算机;2011年08期
2 韩欣;秦帆;;基于概念语义树的语义相似度计算方法研究[J];电脑知识与技术;2011年16期
3 熊芳;;基于混合语义相似度的服务匹配方法[J];微电子学与计算机;2011年08期
4 柳巧玲;尚艳艳;;基于领域本体的语义知识检索研究[J];图书情报工作;2011年06期
5 胡莉;;中文“词”的语言模型识别研究方法综述[J];北方文学(下半月);2011年03期
6 周书锋;陈杰;;基于本体的概念语义相似度计算[J];情报杂志;2011年S1期
7 边振兴;;WordNet中概念语义相似度IC参数模型研究[J];计算机工程与应用;2011年19期
8 杨撼岳;陈笑蓉;郑高山;;水族文字笔形编码方法研究[J];计算机工程;2011年14期
9 苏喻;郑诚;马中杰;;基于语义的VSM模型改进[J];计算机应用与软件;2011年08期
10 张晓孪;王西锋;;基于本体和相似图的概念语义相似度计算[J];计算机技术与发展;2011年08期
中国重要会议论文全文数据库 前10条
1 李月雷;师瑞峰;林丽冰;周一民;;汉语语句语义相似度的计算方法[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
2 关毅;王晓龙;;基于统计的汉语词汇间语义相似度计算[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
3 ;中国中文信息学会交流材料[A];2011年网络学术交流研讨会交流材料[C];2011年
4 孙玉芳;;中文信息处理与国家信息化建设[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
5 陈文亮;朱靖波;吕学强;姚天顺;;词性标注规则的获取和优化[A];第一届学生计算语言学研讨会论文集[C];2002年
6 ;前言[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
7 刘春荣;;我国当务之急是解决中文书写方式的根本变革[A];中国中文信息学会汉字编码专业委员会第九届年会暨学术研讨会论文集[C];2011年
8 黄佳来;王立波;袁道敏;;基于语义相似度的查询扩展研究[A];浙江省电子学会2008年学术年会论文集[C];2008年
9 刘晓平;沈冠町;;协同讨论观点影响度分析方法及其应用[A];全国第22届计算机技术与应用学术会议(CACIS·2011)暨全国第3届安全关键技术与应用(SCA·2011)学术会议论文摘要集[C];2011年
10 李毅;亢世勇;孙茂松;孙道功;;基于奥运语料的语义成分标注规范[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
中国重要报纸全文数据库 前10条
1 记者 梁捷;我国中文信息处理技术从实验室走向全面应用[N];光明日报;2009年
2 姚双云 华中师范大学语言与语言教育研究中心;虚词知识库:中文信息处理的基石[N];中国社会科学报;2011年
3 倪光南;活力重现的中文信息处理[N];计算机世界;2001年
4 齐悦;速记界泰斗唐亚伟 获中文信息处理领域最高科技奖[N];中国质量报;2006年
5 张波 龙雨;中文信息处理国际学术会议在武汉大学召开[N];中国社会科学院院报;2007年
6 记者 段佳;中文信息处理技术加速前行[N];大众科技报;2009年
7 记者 韩晓玲通讯员 张波 龙雨;海内外专家聚焦中文信息处理[N];湖北日报;2007年
8 本报记者 毛国兵 通讯员 岚宇;亚伟速录:实现中文信息处理产业化的自主品牌[N];中国贸易报;2008年
9 胡唯元;文字编码新标准:不再为“名”所累[N];科技日报;2006年
10 本报记者 关逸民;中文速录成为自主核心技术产业[N];中国信息报;2006年
中国博士学位论文全文数据库 前10条
1 宋玲;语义相似度计算及其应用研究[D];山东大学;2009年
2 宋春阳;面向信息处理的现代汉语“名+名”逻辑语义研究[D];上海师范大学;2003年
3 由丽萍;构建现代汉语框架语义知识库技术研究[D];上海师范大学;2006年
4 周卫华;面向中文信息处理的现代汉语动宾语义搭配研究[D];华中师范大学;2007年
5 周子力;基于WordNet的本体构建及其在安全领域应用关键技术研究[D];华东师范大学;2009年
6 潘建国;基于语义的用户建模技术与应用研究[D];上海大学;2009年
7 胡晓;支持机械产品概念设计的功能知识聚类方法研究[D];上海交通大学;2011年
8 詹卫东;面向中文信息处理的现代汉语短语结构规则研究[D];北京大学;1999年
9 李宏伟;基于Ontology的地理信息服务研究[D];解放军信息工程大学;2007年
10 杨峰;本体映射关键技术研究[D];吉林大学;2011年
中国硕士学位论文全文数据库 前10条
1 郑丽萍;本体映射的研究[D];山东科技大学;2005年
2 张红宇;数据集成中本体映射的研究[D];中南大学;2005年
3 张祎挺;语义角色标注及其在句子相似度计算上的应用[D];北京邮电大学;2008年
4 胡艳波;基于区间直觉模糊集的语义相似度研究[D];曲阜师范大学;2012年
5 常晓环;基于概念图的语义检索方法研究[D];吉林大学;2009年
6 陶东成;基于Linux和XIM协议的中文输入法服务器的实现及其应用[D];苏州大学;2004年
7 任波;基于语义的Web服务发现研究[D];浙江工业大学;2005年
8 罗忠毅;数字化中医古籍的理想模式及其相关问题研究[D];成都中医药大学;2005年
9 王敏;基于改进的隐马尔科夫模型汉语词性标注[D];山西大学;2007年
10 秦鹏;基于WordNet的本体匹配关键技术研究与实现[D];华东师范大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026