收藏本站
《第六届全国信息检索学术会议论文集》2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于优化维汉双语词典的多语言信息检索系统

倪耀群  许洪波  谭婧霞  唐慧丰  程学旗  孟丹  
【摘要】:为方便维吾尔文与汉文使用者的信息交流和双语教学,作者使用经过优化的双语词典构建了维、汉多语言信息检索系统,该系统分为索引生成、多语言检索和摘要三个组成部分。首先采集网络上包含这两种文字的网页,将网页正文统一转换为UTF-8编码存储,然后按照汉维文词典合并后的UTF-8词表分词,使用中科院计算计算研究所I3Search(UTF-8版)建立索引。多语言检索通过翻译查询语句实现,支持多语言混合检索(如(?)网站)和单一语言检索(如维吾尔文网站)两种方式。多语言混合检索结果比较精确但是对使用者的语言要求很高;而根据双语词典,允许用户输入单一语言检索相对容易,但是词典中多义词和同义词现象导致检索结果精确率不高。多语言的摘要通过在正文中以字符为单位滑动寻找查询关键词出现最密集的窗口,加标签并截断尾部残缺字符后显示,取得了较为满意的效果。

【参考文献】
中国期刊全文数据库 前1条
1 闵金明;孙乐;张俊林;;重新审视跨语言信息检索[J];中文信息学报;2006年04期
中国硕士学位论文全文数据库 前1条
1 瓦热斯江·阿布都克力木;维文Unicode在线处理技术与实现[D];新疆大学;2002年
【共引文献】
中国硕士学位论文全文数据库 前1条
1 姚晓龙;基于JAVA的维文输入法与界面布局的设计与实现[D];新疆大学;2005年
【二级参考文献】
中国期刊全文数据库 前4条
1 王进,陈恩红,张振亚,王煦法;基于本体的跨语言信息检索模型[J];中文信息学报;2004年03期
2 闵金明;孙乐;张俊林;;重新审视跨语言信息检索[J];中文信息学报;2006年04期
3 徐波;史晓东;刘群;宗成庆;庞薇;陈振标;杨振东;魏玮;杜金华;陈毅东;刘洋;熊德意;侯宏旭;何中军;;2005统计机器翻译研讨班研究报告[J];中文信息学报;2006年05期
4 王妙娅,赖茂生;跨语言信息检索中的询问翻译方法及其研究进展[J];现代图书情报技术;2005年04期
中国硕士学位论文全文数据库 前1条
1 张东伟;中英文跨语言信息检索模型研究[D];黑龙江大学;2006年
【相似文献】
中国期刊全文数据库 前10条
1 张倩;;依托智能搜索引擎构建档案信息检索系统的策略研究[J];档案与建设;2011年06期
2 黄炜;;KNN在企业信息检索中的运用[J];信息技术;2011年06期
3 ;新产品&新工具[J];程序员;2010年07期
4 张玉红;钱崇东;;多语言编程在高炉喷煤PLC控制系统中的应用[J];自动化博览;2011年08期
5 才让叁智;安见才让;;藏汉英混合文档的字数统计研究[J];网络与信息;2011年07期
6 成颖;孙建军;郑彦宁;潘云涛;;学术新人的信息行为研究[J];图书情报知识;2011年04期
7 本刊编辑部;;全国图书馆学情报学精选文摘(第36辑)[J];图书馆理论与实践;2011年07期
8 田萱;李冬梅;;上下文信息检索研究综述[J];计算机科学;2011年09期
9 张泽清;;基于领域本体的语义检索技术研究[J];赤峰学院学报(自然科学版);2011年06期
10 葛景陶;;基于改进蚁群算法的高校图书馆书目检索策略研究[J];长沙铁道学院学报(社会科学版);2011年02期
中国重要会议论文全文数据库 前10条
1 倪耀群;许洪波;谭婧霞;唐慧丰;程学旗;孟丹;;基于优化维汉双语词典的多语言信息检索系统[A];第六届全国信息检索学术会议论文集[C];2010年
2 张森嘉;简世杰;涂家章;;多语言自动总机系统[A];新世纪的现代语音学——第五届全国现代语音学学术会议论文集[C];2001年
3 林耀燊;李文捷;黄绵辉;;信息检索系统中的自然语言处理[A];复杂巨系统理论·方法·应用——中国系统工程学会第八届学术年会论文集[C];1994年
4 张赪军;黄红梅;王晨熙;李军;;构建智能信息检索系统[A];全国第4届信号和智能信息处理与应用学术会议论文集[C];2010年
5 龚昊;张建生;;C#下多语言软件界面的实现[A];中国新闻技术工作者联合会五届一次理事会暨学术年会论文集(上篇)[C];2009年
6 薛巍;李维佳;穆飞;舒继武;;PDPI:一种面向多核的可扩展并行索引算法[A];全国网络与信息安全技术研讨会论文集(下册)[C];2007年
7 辛欣;李涓子;;基于Java语言全文信息检索系统的设计与实现[A];促进企业信息化进程——第十届中国Java技术及应用大会文集[C];2007年
8 颜端武;李晓鹏;王磊;成晓;;文本聚类中基于本体的相似性测度(英文)[A];全国语域web与本体能研讨会论文集[C];2006年
9 陈康;武港山;;基于Ontology的信息检索技术研究[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
10 张乃岳;张学燕;;基于个体词语相似度的定制化动态信息检索[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
中国重要报纸全文数据库 前10条
1 ;整合信息资源 提升服务能力[N];中国计算机报;2005年
2 周;互联网进入多语言国际域名时代[N];计算机世界;2003年
3 记者 刘安;“全国档案报刊文献及科技成果信息检索系统”通过鉴定[N];中国档案报;2002年
4 张咏;“奥运会多语言服务”系统被奥组委采用[N];北京日报;2007年
5 晓丹;多语言版本电子商务网促动跨国贸易[N];中国建材报;2007年
6 刘溟;为奥运提供多语言服务[N];经济日报;2008年
7 湖北 宋振江;多语言Win XP轻松拥有[N];电脑报;2004年
8 曾宪勇;金山WPS2007首发多语言版[N];电脑商报;2007年
9 记者 刘昊;奥运多语言服务中心今日挂牌[N];北京日报;2008年
10 焱木;期待奥运文化活动的多语言服务[N];中国文化报;2008年
中国博士学位论文全文数据库 前10条
1 曲卫民;中文XML信息检索系统的研究[D];中国科学院研究生院(软件研究所);2004年
2 张毅波;史文结构化信息检索系统的研究与实现[D];中国科学院研究生院(软件研究所);2001年
3 杨传耀;中文信息检索索引模型及相关技术研究[D];复旦大学;2007年
4 杨为民;基于场论的信息检索模型的研究[D];安徽大学;2007年
5 刘涛;现代信息检索中的文本分类及图像恢复研究[D];北京邮电大学;2006年
6 熊文新;信息检索Query语言分析[D];北京语言大学;2006年
7 韩忠明;基于XML的数据查询和信息检索集成化系统研究[D];东华大学;2006年
8 颜端武;面向知识服务的智能推荐系统研究[D];南京理工大学;2007年
9 刘健;面向信息检索的文本信息组织关键技术研究[D];国防科学技术大学;2009年
10 朱明杰;互联网搜索系统中的高性能查询问题研究[D];中国科学技术大学;2009年
中国硕士学位论文全文数据库 前10条
1 顾鑫;个性化智能信息检索系统研究[D];哈尔滨工程大学;2004年
2 倪良胜;面向海量实时数据信息检索系统的研究与实现[D];东南大学;2004年
3 赵爽;软件测试在信息检索系统中的应用[D];西安电子科技大学;2008年
4 王宏霞;基于ONTOLOGY的信息检索系统的研究[D];河北工业大学;2005年
5 李勇;关于本体整合的研究及其在供应链管理中的应用[D];天津大学;2005年
6 陈朋;基于网络的集成化信息检索平台研究[D];武汉大学;2005年
7 彭鹏;基于本体的信息检索策略优化研究[D];吉林大学;2007年
8 陈琮;基于Jena的本体检索模型设计与实现[D];武汉大学;2005年
9 王娜;XML在信息检索系统中的应用及评价研究[D];武汉大学;2005年
10 赵鹏;高校数字图书馆网站建设的研究[D];山西大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026