收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于伪LCS的中文专利句子相似度计算方法

卢延科  尹宝生  张桂平  苗雪雷  白宇  
【摘要】:针对专利文献专业术语相对较多、形式规范、语言严谨的特点,本文提出了一种基于伪LCS的句子相似度计算方法。该方法通过对传统的最长公共子串(LCS)算法进行改进,并加入了词汇语义信息、词类和术语相相似度等相关信息,使其具有模糊对齐的能力,更适合专利文献中句子相似度的计算。实验结果表明该方法在专利句子相似度计算方面取得了较好效果。

知网文化
【相似文献】
中国重要会议论文全文数据库 前1条
1 卢延科;尹宝生;张桂平;苗雪雷;白宇;;基于伪LCS的中文专利句子相似度计算方法[A];第五届全国信息检索学术会议论文集[C];2009年
中国硕士学位论文全文数据库 前1条
1 卢延科;面向中文专利文献的相似例句检索算法的研究[D];沈阳航空工业学院;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978