收藏本站
《语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集》2003年
收藏 | 手机打开
二维码
手机客户端打开本文

面向双语句对检索的汉语句子相似度计算

车万翔  刘挺  秦兵  李生  
【摘要】:在基于大规模的双语句对语料库的英文辅助写作系统中,我们采用了一种改进编辑距离的句子相似度计算方法,即对以往的编辑距离算法进行适当的调整,考虑了更多的汉语结构信息,使之更加符合汉语的句子相似度计算。同时使用了HowNet和《同义词词林》两部语义辞典作为语义资源,计算词汇之间的相似度。改进编辑距离的算法与单纯基于语义辞典计算句子相似度的算法相比,具有便于扩展,准确率高等优点,在英文辅助写作领域取得了令人满意的效果。对其进行适当的改进后,可适于多数需要计算句子相似度的应用领域。

手机知网App
【引证文献】
中国期刊全文数据库 前2条
1 金博,史彦军,滕弘飞;基于语义理解的文本相似度算法[J];大连理工大学学报;2005年02期
2 钱丽萍;汪立东;;基于中心短语及权值的相似度计算[J];郑州大学学报(理学版);2007年02期
中国重要会议论文全文数据库 前1条
1 张宇;刘挺;高立琦;车万翔;朱传靖;;基于常问问题集的在线客服实验研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
中国硕士学位论文全文数据库 前5条
1 张辉丽;计算机领域中文自动问答系统的研究[D];天津大学;2006年
2 安利斌;基于知网的内容知晓研究[D];太原理工大学;2006年
3 张艳;面向高校师生的应用文机辅写作关键技术研究[D];大连理工大学;2006年
4 于国权;面向C语言题库的相似试题辨别方法研究[D];哈尔滨工业大学;2006年
5 张学;EBMT系统中翻译模板的抽取与匹配[D];大连理工大学;2006年
【参考文献】
中国重要会议论文全文数据库 前1条
1 王洋;秦兵;郑实福;;句子相似度计算在FAQ中的应用[A];第一届学生计算语言学研讨会论文集[C];2002年
【共引文献】
中国期刊全文数据库 前7条
1 夏天,樊孝忠,刘林,骆正华;基于ALICE的汉语自然语言接口[J];北京理工大学学报;2004年10期
2 李志辉;智能答疑系统中概念词典的设计与应用[J];重庆科技学院学报(社会科学版);2005年02期
3 余正涛,高盛祥,纪鹏程;RDAQAS中问句相似度计算方法研究[J];昆明理工大学学报(理工版);2004年02期
4 秦春秀;赵捧未;刘怀亮;;词语相似度计算研究[J];情报理论与实践;2007年01期
5 章成敏,鞠海燕;基于混合策略的中文查询串相似度计算[J];情报杂志;2005年11期
6 李志辉;周竹荣;;基于领域知网的中文智能答疑系统[J];四川理工学院学报(自然科学版);2005年04期
7 赵赟,刘亚军;智能答疑系统中语义网的研究与应用[J];微机发展;2003年11期
中国重要会议论文全文数据库 前6条
1 刘艳芳;封化民;丁天昌;;中文视频问答系统研究[A];第二届和谐人机环境联合学术会议(HHME2006)——第15届中国多媒体学术会议(NCMT'06)论文集[C];2006年
2 章成志;;词语的语义相似度计算及其应用研究[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
3 赵妍妍;秦兵;刘挺;张俐;苏中;;基于多特征融合的句子相似度计算[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
4 张宇;刘挺;高立琦;车万翔;朱传靖;;基于常问问题集的在线客服实验研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
5 菅小艳;郑家恒;;一种改进的句子相似度计算方法[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
6 白宇;蔡东风;赵环宇;季铎;;基于语义计算的中文相似问句抽取[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
中国博士学位论文全文数据库 前6条
1 吴健;基于Web服务的网络化产品配置技术研究[D];浙江大学;2004年
2 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
3 刘云峰;基于潜在语义分析的中文概念检索研究[D];华中科技大学;2005年
4 于满泉;面向人物追踪的知识挖掘研究[D];中国科学院研究生院(计算技术研究所);2006年
5 王树西;基于文本模式推理的问答系统研究[D];中国科学院研究生院(计算技术研究所);2005年
6 秦忠宝;基于混合知识表示的设计创新及知识获取研究[D];西北工业大学;2006年
中国硕士学位论文全文数据库 前10条
1 李珊;远程教学中自动答疑系统的研究[D];河海大学;2004年
2 刘超群;实时答疑系统的研究与实现[D];湖南大学;2004年
3 张瑞霞;基于语义的汉语句法分析系统的研究与实现[D];西北大学;2005年
4 孙书梅;基于电子白板的即时通信系统的研究与实现[D];武汉理工大学;2006年
5 李志辉;基于专业知网的中文智能答疑系统模型研究[D];西南大学;2006年
6 黄莉;基于受限域常问问答库的中文问答系统研究[D];昆明理工大学;2007年
7 邓爽;基于本体的文本分类模型研究[D];西华大学;2007年
8 周文刚;基于语义的信息过滤算法及其应用[D];北方工业大学;2006年
9 林丽;基于语义距离的文本聚类算法研究[D];厦门大学;2007年
10 刘伟;基于限定领域的问句相似度[D];天津师范大学;2008年
【同被引文献】
中国期刊全文数据库 前10条
1 刘颖;现代汉语中几种表示相同比较的句式[J];安徽师范大学学报(人文社会科学版);2000年03期
2 穗志方,俞士汶;汉语单句谓语中心词识别知识的获取及应用[J];北京大学学报(自然科学版);1998年Z1期
3 骆正华,樊孝忠,刘林,龚永罡;基于E-Chunk的问句实例分析系统[J];北京理工大学学报;2005年01期
4 汤世平;樊孝忠;;基于多示例学习的题库重复性检测研究[J];北京理工大学学报;2005年12期
5 吕学强,任飞亮,黄志丹,姚天顺;句子相似模型和最相似句子查找算法[J];东北大学学报(自然科学版);2003年06期
6 董振东,董强;知网和汉语研究[J];当代语言学;2001年01期
7 林鸿飞,高仁璟;基于潜在语义索引的文本摘要方法[J];大连理工大学学报;2001年06期
8 金博,滕弘飞,史彦军,王丹虹;机辅写作:样本库中写作材料检索方法[J];大连理工大学学报;2002年05期
9 史彦军,滕弘飞,金博;抄袭论文识别研究与进展[J];大连理工大学学报;2005年01期
10 金博,史彦军,滕弘飞;基于语义理解的文本相似度算法[J];大连理工大学学报;2005年02期
中国重要会议论文全文数据库 前9条
1 车万翔;刘挺;秦兵;李生;;面向依存文法分析的搭配抽取方法研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 王洋;秦兵;郑实福;;句子相似度计算在FAQ中的应用[A];第一届学生计算语言学研讨会论文集[C];2002年
3 关毅;王晓龙;;基于统计的汉语词汇间语义相似度计算[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
4 李斌;蔡东风;;一种基于语义距离和语境相似度的词义排歧方法[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
5 李伟;苑春法;黄锦辉;李文捷;;基于关键句矢量模型的文本相似性计算[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
6 龙昊;蔡东风;;一种基于词匹配的句子相似度计算方法[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
7 曲维光;;分词系统计量研究与改进方案[A];第二届全国学生计算语言学研讨会论文集[C];2004年
8 丁秉公;黄昌宁;黄德根;;文本主题识别研究及应用[A];第二届全国学生计算语言学研讨会论文集[C];2004年
9 王灿辉;金奕江;马少平;;基于文档中心内容快速提取的Web监控辅助系统[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
中国博士学位论文全文数据库 前1条
1 李素建;汉语组块计算的若干研究[D];中国科学院研究生院(计算技术研究所);2002年
中国硕士学位论文全文数据库 前7条
1 朱珣;中文自动分词系统的研究[D];华中师范大学;2004年
2 张兰轩;基于潜在语义分析的大学概况中文问答系统[D];大连理工大学;2004年
3 朱代华;基于分词技术的智能答疑系统[D];重庆大学;2004年
4 李力;利用知网进行(计算机)自然语言处理[D];电子科技大学;2004年
5 王源媛;中文未登录名词短语的识别方法研究[D];重庆大学;2004年
6 段立;语境计算在词语歧义消解中的应用[D];华东师范大学;2006年
7 孙爽;基于语义相似度的文本聚类算法的研究[D];南京航空航天大学;2007年
【二级引证文献】
中国期刊全文数据库 前1条
1 王生发;顾新建;郭剑锋;马军;战洪飞;;面向产品设计的知识主动推送研究[J];计算机集成制造系统;2007年02期
中国重要会议论文全文数据库 前1条
1 叶正;林鸿飞;杨志豪;;基于问句相似度的中文FAQ问答系统研究[A];第三届学生计算语言学研讨会论文集[C];2006年
中国硕士学位论文全文数据库 前10条
1 王金宝;基于增量学习和阀值优化的自适应信息过滤[D];大连理工大学;2006年
2 张艳;面向高校师生的应用文机辅写作关键技术研究[D];大连理工大学;2006年
3 沈斌;基于分词的中文文本相似度计算研究[D];天津财经大学;2006年
4 张玉娟;基于《知网》的句子相似度计算的研究[D];中国地质大学(北京);2006年
5 刘小宇;基于语义理解的中文常问问答系统的研究[D];大连理工大学;2006年
6 余建华;基于统计原理的甄别算法的研究与应用[D];南京工业大学;2006年
7 孙卫;基于Web的网络考试系统的设计与实现[D];河海大学;2007年
8 郭传鹏;计算机操作痕迹清除系统的研究与实现[D];解放军信息工程大学;2006年
9 吕青普;科技文档的分类与查重[D];天津财经大学;2007年
10 程克敏;基于文本结构和内容的中文论文复制检测系统研究[D];合肥工业大学;2007年
【相似文献】
中国期刊全文数据库 前10条
1 李欢,宋麦玲,杨捷;基于内容的图像检索系统[J];自动化博览;2005年04期
2 史豪杰;邢清华;刘付显;;基于引入概率的范例匹配新方法[J];计算机工程与应用;2009年10期
3 王煜;白石;王正欧;;用于Web文本分类的快速KNN算法[J];情报学报;2007年01期
4 赵俊杰;胡学钢;;基于文本分类的文档相似度计算[J];微型电脑应用;2008年12期
5 郝祥根;杨思春;高远飙;张伟;;基于向量空间模型的中文问答系统研究与实现[J];苏州科技学院学报(自然科学版);2009年01期
6 王波;薛媛媚;;网上销售常问问答系统的构建[J];软件导刊;2009年02期
7 袁正午;李玉森;张雪英;;基于属性的文本相似度计算算法改进[J];计算机工程;2009年17期
8 缪勇;宋斌;;基于Web日志的典型匿名用户路径挖掘研究[J];计算机应用;2009年10期
9 张爱琦;左万利;王英;梁浩;;基于多个领域本体的文本层次被定义聚类方法[J];计算机科学;2010年03期
10 江耿豪;;基于VisualProlog的自动答疑系统设计与实现[J];现代教育技术;2010年07期
中国重要会议论文全文数据库 前10条
1 车万翔;刘挺;秦兵;李生;;面向双语句对检索的汉语句子相似度计算[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 王凯;李绍稳;张友华;刘超;;缺值背景中的粗糙形式概念相似度计算理论与方法[A];中国农业工程学会电气信息与自动化专业委员会、中国电机工程学会农村电气化分会科技与教育专委会2010年学术年会论文摘要[C];2010年
3 陈立;宋自林;郑世明;张英;;基于本体的概念相似度计算研究[A];江苏省系统工程学会第十一届学术年会论文集[C];2009年
4 刘宝艳;林鸿飞;杨志豪;;基于改进编辑距离和依存结构的句子相似度计算[A];第三届学生计算语言学研讨会论文集[C];2006年
5 吴志雄;;不精确数据的相似度计算[A];逻辑学及其应用研究——第四届全国逻辑系统、智能科学与信息科学学术会议论文集[C];2008年
6 张学;黄德根;;EBMT中翻译模板的抽取与匹配[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
7 张雅旭;舒华;张厚粲;周晓林;;汉语句子理解中词汇歧义消解的时间历程[A];第八届全国心理学学术会议文摘选集[C];1997年
8 沈君;马生全;;两种新的相似性度量在模糊推理中的应用[A];中国运筹学会模糊信息与模糊工程分会第五届学术年会论文集[C];2010年
9 封世文;梁丹丹;王美豪;翁旭初;杨亦鸣;;VWFA区与汉语句子阅读加工的fMRI初探[A];2005年中国神经心理学学术会议论文集[C];2005年
10 张迪;郑德权;赵铁军;于浩;;Blog网页分类与识别技术研究[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年
中国重要报纸全文数据库 前10条
1 海量智能计算技术研究中心 霍刚;新兴技术为互联网加速[N];计算机世界;2007年
2 俞志新 李水根;创新——中药跨出国门的基础[N];健康报;2006年
3 记者 洪奕宜;网站特设专区 委员“开博议政”[N];南方日报;2007年
4 田振坤 王连芝;黑龙江中医药大学建立蔓荆子药材指纹图谱[N];中国医药报;2005年
5 窦东友;介词的妙用[N];文汇报;2004年
6 罗红艳;探索语言奥秘的人[N];人民日报海外版;2001年
7 钱民辉;现代性的张扬与民族性的弱化[N];人民政协报;2004年
8 深圳商报记者 陈晓薇;提案从提交到办理电子监控实时跟踪[N];深圳商报;2007年
9 崔昕;浙大中药质控技术取得创新性成果[N];中国医药报;2002年
10 何建昆;复方丹参滴丸指纹图谱分析及质量控制技术通过鉴定[N];科技日报;2004年
中国博士学位论文全文数据库 前10条
1 宋万鹏;短文本相似度计算在用户交互式问答系统中的应用[D];中国科学技术大学;2010年
2 吴碧宇;汉语句子话题链的认定及其意义研究[D];中央民族大学;2010年
3 王秀红;文本相似度计算核函数的构造及其在分布式信息检索中的应用研究[D];江苏大学;2012年
4 李茹;汉语句子框架语义结构分析技术研究[D];山西大学;2012年
5 李辉;移动商务导购系统的研究[D];大连理工大学;2008年
6 史先敏;中国栽培灵芝三萜成分的高效液相指纹图谱研究[D];南京农业大学;2008年
7 李进;两性霉素B有关物质的质量研究与多元组分药物的质量控制和分析[D];中国协和医科大学;2007年
8 王吉华;基于特征函数的产品造型进化设计研究[D];山东师范大学;2009年
9 吴梅;俄汉语句子中过渡现象对比研究[D];上海外国语大学;2009年
10 吴健;基于Web服务的网络化产品配置技术研究[D];浙江大学;2004年
中国硕士学位论文全文数据库 前10条
1 王利局;基于语义分析树核的句子相似度计算[D];大连理工大学;2008年
2 王德刚;智能答疑系统的设计[D];内蒙古大学;2008年
3 张宇;关系数据库中基于元组的关键词查询研究[D];燕山大学;2009年
4 张平生;计算机辅助飞机协调图表设计技术研究[D];西北工业大学;2007年
5 郭竞;三维地形模型检索系统设计与实现[D];西北大学;2007年
6 王婷;OWL本体之间概念相似度计算研究[D];河海大学;2007年
7 蔡元哲;本体实例学习关键技术的研究[D];中国人民大学;2008年
8 刘岩;基于概念图的中文语义分析系统的研究与实现[D];西北大学;2008年
9 王少鹏;基于网页标识的图像内容过滤防火墙的设计[D];山西大学;2008年
10 赵火军;基于引文链的知识元挖掘方法研究[D];西安电子科技大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026