收藏本站
《第五届全国信息检索学术会议论文集》2009年
收藏 | 手机打开
二维码
手机客户端打开本文

基于伪LCS的中文专利句子相似度计算方法

卢延科  尹宝生  张桂平  苗雪雷  白宇  
【摘要】:针对专利文献专业术语相对较多、形式规范、语言严谨的特点,本文提出了一种基于伪LCS的句子相似度计算方法。该方法通过对传统的最长公共子串(LCS)算法进行改进,并加入了词汇语义信息、词类和术语相相似度等相关信息,使其具有模糊对齐的能力,更适合专利文献中句子相似度的计算。实验结果表明该方法在专利句子相似度计算方面取得了较好效果。

手机知网App
【参考文献】
中国期刊全文数据库 前2条
1 王荣波,池哲儒;基于词类串的汉语句子结构相似度计算方法[J];中文信息学报;2005年01期
2 徐建民;白彦霞;吴树芳;;基于术语相似度的贝叶斯网络检索模型扩展[J];计算机工程;2007年16期
【共引文献】
中国期刊全文数据库 前10条
1 夏天,樊孝忠,刘林,骆正华;基于ALICE的汉语自然语言接口[J];北京理工大学学报;2004年10期
2 骆正华,樊孝忠,刘林,龚永罡;基于E-Chunk的问句实例分析系统[J];北京理工大学学报;2005年01期
3 李志辉;智能答疑系统中概念词典的设计与应用[J];重庆科技学院学报(社会科学版);2005年02期
4 王常亮;滕至阳;;语句相似度计算在FAQ中的应用[J];计算机时代;2006年02期
5 杨晓明;罗振声;;模式匹配在中文问答系统中的应用研究[J];科学技术与工程;2006年03期
6 张宇,刘挺,文勖;基于改进贝叶斯模型的问题分类[J];中文信息学报;2005年02期
7 秦兵,刘挺,李生;多文档自动文摘综述[J];中文信息学报;2005年06期
8 秦春秀;赵捧未;刘怀亮;;词语相似度计算研究[J];情报理论与实践;2007年01期
9 章成敏,鞠海燕;基于混合策略的中文查询串相似度计算[J];情报杂志;2005年11期
10 闫宏飞,陈翀;词汇与中心词的距离信息对问句相似度匹配的影响[J];清华大学学报(自然科学版);2005年S1期
中国重要会议论文全文数据库 前9条
1 张忠平;;Similarity Measure Based on Structure and Semantic Constraints for XML Documents[A];2006年全国理论计算机科学学术年会论文集[C];2006年
2 车万翔;刘挺;秦兵;李生;;面向双语句对检索的汉语句子相似度计算[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
3 章成志;;词语的语义相似度计算及其应用研究[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
4 秦兵;刘挺;高晔;;多文档集合中逻辑主题的确定[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
5 赵妍妍;秦兵;刘挺;张俐;苏中;;基于多特征融合的句子相似度计算[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
6 张宇;刘挺;高立琦;车万翔;朱传靖;;基于常问问题集的在线客服实验研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
7 菅小艳;郑家恒;;一种改进的句子相似度计算方法[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
8 叶正;林鸿飞;杨志豪;;基于问句相似度的中文FAQ问答系统研究[A];第三届学生计算语言学研讨会论文集[C];2006年
9 白宇;蔡东风;赵环宇;季铎;;基于语义计算的中文相似问句抽取[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
中国博士学位论文全文数据库 前8条
1 徐海渊;基于XML的动态信息触发机制的研究[D];中国人民解放军国防科学技术大学;2002年
2 唐玉荣;生物信息学中的序列比对算法研究[D];中国农业大学;2004年
3 吴健;基于Web服务的网络化产品配置技术研究[D];浙江大学;2004年
4 张忠平;基于约束的XML数据库模式规范化研究[D];复旦大学;2004年
5 刘云峰;基于潜在语义分析的中文概念检索研究[D];华中科技大学;2005年
6 于满泉;面向人物追踪的知识挖掘研究[D];中国科学院研究生院(计算技术研究所);2006年
7 秦忠宝;基于混合知识表示的设计创新及知识获取研究[D];西北工业大学;2006年
8 段建勇;多词表达抽取及其应用[D];上海交通大学;2007年
中国硕士学位论文全文数据库 前10条
1 侯丽敏;基于网络的智能答疑系统的研究与实现[D];河南大学;2005年
2 周舫;汉语句子相似度计算方法及其应用的研究[D];河南大学;2005年
3 胡斌;变更信息管理机制及其在PDM变更管理中的应用[D];浙江大学;2004年
4 李珊;远程教学中自动答疑系统的研究[D];河海大学;2004年
5 刘超群;实时答疑系统的研究与实现[D];湖南大学;2004年
6 李桂香;保证意愿的协同版本合并算法与实现[D];南京师范大学;2004年
7 徐晓华;光并行计算及其在图像处理和计算分子生物学中的应用[D];扬州大学;2005年
8 张瑞霞;基于语义的汉语句法分析系统的研究与实现[D];西北大学;2005年
9 孙书梅;基于电子白板的即时通信系统的研究与实现[D];武汉理工大学;2006年
10 徐宁;基于案例推理的上市公司失败预警系统研究[D];合肥工业大学;2006年
【二级参考文献】
中国期刊全文数据库 前6条
1 李素建;基于语义计算的语句相关度研究[J];计算机工程与应用;2002年07期
2 徐建民;白彦霞;吴树芳;;基于同义词扩展的贝叶斯网络检索模型[J];计算机应用;2006年11期
3 胡俊峰 ,俞士汶;唐宋诗中词汇语义相似度的统计分析及应用[J];中文信息学报;2002年04期
4 李红莲,何伟,袁保宗;一种文本相似度及其在语音识别中的应用[J];中文信息学报;2003年01期
5 冯志伟;论歧义结构的潜在性[J];中文信息学报;1995年04期
6 陆勇,侯汉清;用于信息检索的同义词自动识别及其进展[J];南京农业大学学报(社会科学版);2004年03期
【相似文献】
中国重要会议论文全文数据库 前1条
1 卢延科;尹宝生;张桂平;苗雪雷;白宇;;基于伪LCS的中文专利句子相似度计算方法[A];第五届全国信息检索学术会议论文集[C];2009年
中国硕士学位论文全文数据库 前1条
1 卢延科;面向中文专利文献的相似例句检索算法的研究[D];沈阳航空工业学院;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026