收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

一种改进的句子相似度计算方法

菅小艳  郑家恒  
【摘要】:句子相似度计算在中文信息处理中有若非常广泛的应用。本文采用农作物种子信息文本,对句子进行深入的研究,通过对《同义词词林》的扩充,提出一种基于扩展的句子相似度的计算。该方法结合语料的特点,不仅考虑了句子间的公共子串,而且兼顾了词义距离。在对农作物种子文本的主题聚类的试验中,达到了比较满意的效果。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 赵巾帼;徐德智;罗庆云;;汉语句子相似度计算方法比对之研究[J];福建电脑;2007年10期
2 秦新国;;基于句子相似度的文档复制检测算法研究[J];现代图书情报技术;2007年11期
3 秦兵,刘挺,王洋,郑实福,李生;基于常问问题集的中文问答系统研究[J];哈尔滨工业大学学报;2003年10期
4 张翼燕;吴雯娜;丹英;;一种新的用户满意度影响因子权重计算方法研究[J];情报杂志;2009年06期
5 薛慧芳;;句子相似度计算初探[J];科技信息;2009年19期
6 吉胜军;;基于Levenshtein distance算法的句子相似度计算[J];电脑知识与技术;2009年09期
7 何维;王宇;;基于句子关系图的网页文本主题句抽取[J];现代图书情报技术;2009年03期
8 陈笑筑;王东;陈笑蓉;;基于页面标签的网页分类研究[J];商场现代化;2009年19期
9 郭书杰;黄明;梁旭;;陪护机器人口语对话系统设计与实现[J];网络安全技术与应用;2010年12期
10 刘玉娟;孙晓颖;温泉;王亮;;层次分析法在虚拟实验教学评估中的应用[J];实验室研究与探索;2010年10期
11 刘建舟;刘晓华;;主观题自动批改技术的研究[J];湖北工业大学学报;2006年04期
12 黄丽琼;何中市;;基于统计语义和结构特征的自动文摘[J];广西师范大学学报(自然科学版);2006年04期
13 索红光;梁玉环;刘玉树;;基于时间戳的多文档自动文摘[J];计算机工程;2007年16期
14 庞宁;杨尔弘;;网页文本分类中的特征选择研究[J];太原科技大学学报;2007年04期
15 乌庆敏;杨思春;;概念向量空间模型在智能答疑系统中的应用[J];安徽工业大学学报(自然科学版);2008年02期
16 吴天福;邓华强;伍人涛;;基于主成分分析的力量结构指标权重计算[J];微计算机信息;2009年16期
17 邢长征;孙伟;;一种改进的基于句子相似度的检测算法[J];计算机系统应用;2010年02期
18 孔胜;王宇;;基于句子相似度的文本主题句提取算法研究[J];情报学报;2011年06期
19 陆小丽;何加铭;;基于Map/Reduce的索引数据云存储模型研究[J];宁波大学学报(理工版);2011年03期
20 卢志翔;蒙丽莉;;文本分类中特征项权重算法的改进[J];柳州师专学报;2011年04期
中国重要会议论文全文数据库 前10条
1 菅小艳;郑家恒;;一种改进的句子相似度计算方法[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
2 宋彦;张桂平;蔡东风;;基于N-gram的句子相似度计算技术[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
3 王健;安波;林鸿飞;;基于修正网络的蛋白质络合物预测[A];第五届全国信息检索学术会议论文集[C];2009年
4 张宇;刘挺;高立琦;车万翔;朱传靖;;基于常问问题集的在线客服实验研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
5 王玮;张玉芝;;满足一致性条件的最小修正判断矩阵方法研究[A];2005中国控制与决策学术年会论文集(下)[C];2005年
6 刘阳琦;岳冬梅;赵景斐;;原子时加权平均算法设计实现[A];2009全国时间频率学术会议论文集[C];2009年
7 周华旭;;对抽水蓄能电站工程建设项目评标的研究[A];抽水蓄能电站工程建设文集(2010)[C];2010年
8 张天云;杨瑞成;陈奎;;生物医药材料评价指标的组合赋权模型研究[A];第六届中国功能材料及其应用学术会议论文集(5)[C];2007年
9 郝琪;杨自厚;汪定伟;王梦光;;一种通用冶金产品质量评价决策支持系统设计及实现[A];1993中国控制与决策学术年会论文集[C];1993年
10 ;2005年7月撮合月报[A];棉花质量检验体制改革试点工作总结会论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 薛德军;中文文本自动分类中的关键问题研究[D];清华大学;2004年
2 谢学敏;基于动态流通语料库(DCC)的流行语释义信息自动提取研究[D];北京语言大学;2006年
3 刘云峰;基于潜在语义分析的中文概念检索研究[D];华中科技大学;2005年
4 张翔;文本挖掘技术研究及其在综合风险信息网络中的应用[D];西北大学;2011年
5 朱振方;基于微粒群和遗传优化的文本过滤关键技术研究[D];山东师范大学;2012年
6 刘玉国;基于内容的互联网舆情信息挖掘关键技术研究[D];山东大学;2011年
7 王小芳;文本主题域划分与无监督特征提取[D];吉林大学;2009年
8 蒋昌金;基于关键词提取的中文网页自动文摘方法研究[D];华南理工大学;2010年
9 张冬梅;文本情感分类及观点摘要关键问题研究[D];山东大学;2012年
10 吴娅辉;语音识别中区分性训练算法研究[D];北京邮电大学;2009年
中国硕士学位论文全文数据库 前10条
1 薛慧芳;句子相似度计算理论及应用研究[D];西北大学;2011年
2 刘欣;智能答疑系统中句子相似度计算的研究与应用[D];电子科技大学;2011年
3 赵彦军;基于词条数学期望的词条权重计算算法研究[D];安徽工业大学;2010年
4 杨茂;基于句子相似度的文本比对算法研究[D];电子科技大学;2010年
5 张振幸;基于知网的模块化的中文句子相似度计算研究[D];安徽工业大学;2010年
6 安迪;基于名实体的自动综述系统研究[D];中国石油大学;2009年
7 刘青磊;汉语词语及句子相似度算法研究与应用[D];电子科技大学;2011年
8 黄妮;网络学习平台中的分词与句子相似度算法研究[D];陕西师范大学;2012年
9 王术;面向个性化服务的网页特征描述方法研究[D];重庆大学;2004年
10 张静静;基于知网文本相似度的文摘自动评测方法研究[D];中国石油大学;2011年
中国重要报纸全文数据库 前10条
1 通讯员 彭云 袁龙刚;袁仁国荣膺改革开放30年酒界领军人物[N];经理日报;2009年
2 记者 万宁;业绩增长仍是主流[N];中国证券报;2005年
3 本报记者 汪涛 ;证监会再下严令 迫货币市场基金软着陆[N];21世纪经济报道;2005年
4 李倩;多种价格国债招标方式有望推出[N];金融时报;2004年
5 本报记者 张泰欣;并购贷款操作指引或首季公布[N];中国证券报;2009年
6 童牧野;咫尺天涯 还愿回家[N];中国高新技术产业导报;2000年
7 市财政局办公室提供;市财政研究所得税改革政策[N];玉溪日报;2008年
8 记者 周科竞;上交所推出超大盘指数[N];北京商报;2009年
9 本报记者 安仲文;上证超级大盘指数授权博时开发ETF[N];上海证券报;2009年
10 记者 胡楠 通讯员 孙瑞华;综合能力成考察重点[N];长江日报;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978