收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

弱指导的统计隐含语义分析及其在跨语言信息检索中的应用

金千里  赵军  徐波  
【摘要】:本文提出了一种语义聚类和扩展的新方法,称为有指导的统计隐含语义标引(SPLSI)算法。该算法能基于双语语料,通过机器学习来自动进行语义聚类,生成词间相似度矩阵。和以前的算法相比,SPLSI算法不仅在聚类意义上更加明确、聚类的过程更容易控制,而且降低了时间和空间复杂度。基于SPLSI算法,实现了跨语言信息检索领域的三个系统:多语言文本分类,跨语言文本检索,跨语言关键词扩展。实验结果显示,在准确率、召回率、平均运算时间等多个评价指标中,SPLSI均优于以前的各种算法。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 苏绥;林原;林鸿飞;;语言模型在信息检索中的应用[J];情报学报;2011年07期
2 庞观松;张黎莎;蒋盛益;;个性化跨语言学术搜索技术研究[J];情报学报;2011年08期
3 ;新产品&新工具[J];程序员;2010年07期
4 张玉红;钱崇东;;多语言编程在高炉喷煤PLC控制系统中的应用[J];自动化博览;2011年08期
5 鲍丽倩;张自然;;基于本体的跨语言信息检索在数字图书馆中的应用[J];现代情报;2011年07期
6 才让叁智;安见才让;;藏汉英混合文档的字数统计研究[J];网络与信息;2011年07期
7 赵小兵;邱莉榕;赵铁军;;多民族语言本体知识库构建技术[J];中文信息学报;2011年04期
8 杜艳明;龙丹;;Openbravo ERP国际化编程特点分析与本地化实现[J];计算机系统应用;2011年07期
9 惠冬芳;;浅淡公共图书馆的多元文化服务——以广州图书馆为例[J];黑龙江科技信息;2011年22期
10 丁玉忠;吾守尔·斯拉木;那斯尔江·吐尔逊;;基于垃圾模型的维吾尔语关键词识别[J];现代计算机(专业版);2011年12期
11 ;[J];;年期
12 ;[J];;年期
13 ;[J];;年期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 金千里;赵军;徐波;;弱指导的统计隐含语义分析及其在跨语言信息检索中的应用[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 塔娜;林民;李小庆;宝美荣;;面向跨语言信息检索的蒙汉语义词典构建[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
3 张森嘉;简世杰;涂家章;;多语言自动总机系统[A];新世纪的现代语音学——第五届全国现代语音学学术会议论文集[C];2001年
4 张玥杰;郭依昆;吴立德;;面向英汉的跨语言信息检索关键技术研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
5 王树锋;张永奎;;基于英汉词典和翻译软件的跨语言信息检索实验[A];第一届学生计算语言学研讨会论文集[C];2002年
6 龚昊;张建生;;C#下多语言软件界面的实现[A];中国新闻技术工作者联合会五届一次理事会暨学术年会论文集(上篇)[C];2009年
7 倪耀群;许洪波;谭婧霞;唐慧丰;程学旗;孟丹;;基于优化维汉双语词典的多语言信息检索系统[A];第六届全国信息检索学术会议论文集[C];2010年
8 张孝飞;代六玲;黄河燕;陈肇雄;;跨语言信息检索中查询关键词翻译转换算法[A];全国网络与信息安全技术研讨会'2005论文集(下册)[C];2005年
9 朱红垒;郑德权;赵铁军;;跨语言信息检索中的用户查询翻译方法研究[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
10 郭文;史晓东;陈毅东;;跨语言信息检索中的查询扩展[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
中国博士学位论文全文数据库 前1条
1 双志伟;个性化语音生成研究[D];中国科学技术大学;2011年
中国硕士学位论文全文数据库 前10条
1 宁健;面向生物医学领域的跨语言信息检索[D];大连理工大学;2010年
2 塔娜;面向跨语言信息检索的蒙汉语义词典构建[D];内蒙古师范大学;2011年
3 牛亚萌;跨语言信息检索技术的研究与实现[D];西安电子科技大学;2011年
4 何向真;多语言电子词典构建[D];西北民族大学;2010年
5 毕文霞;基于中间语义的跨语言文本分类模型研究[D];江西师范大学;2008年
6 高昆元;多语言多层架构ERP系统的设计与实现[D];湖南大学;2005年
7 曹佳;面向世博的多语言综合信息服务系统研究与设计[D];复旦大学;2011年
8 李思舒;一种多语言、多编码的识别方法[D];南京大学;2012年
9 闭剑婷;潜在语义分析在跨语言信息检索中的应用研究[D];广西大学;2008年
10 黄国斌;基于中间语义的跨语言信息检索研究[D];江西师范大学;2008年
中国重要报纸全文数据库 前10条
1 周;互联网进入多语言国际域名时代[N];计算机世界;2003年
2 张咏;“奥运会多语言服务”系统被奥组委采用[N];北京日报;2007年
3 晓丹;多语言版本电子商务网促动跨国贸易[N];中国建材报;2007年
4 刘溟;为奥运提供多语言服务[N];经济日报;2008年
5 湖北 宋振江;多语言Win XP轻松拥有[N];电脑报;2004年
6 曾宪勇;金山WPS2007首发多语言版[N];电脑商报;2007年
7 记者 刘昊;奥运多语言服务中心今日挂牌[N];北京日报;2008年
8 焱木;期待奥运文化活动的多语言服务[N];中国文化报;2008年
9 寻美琴母佳思;奥运多语言服务中心落成[N];人民日报海外版;2008年
10 记者 红娟;启动奥运会多语言服务中心[N];中华读书报;2008年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978