收藏本站
《NCIRCS2004第一届全国信息检索与内容安全学术会议论文集》2004年
收藏 | 手机打开
二维码
手机客户端打开本文

词性标注对信息检索系统性能的影响

苏祺  昝红英  胡景贺  项锟  
【摘要】:在信息检索中引入NLP 技术是信息检索发展的主要趋势,本文将NLP 中较为成熟的词性标注技术加入信息检索,采用大规模TREC 数据集,试图发现词性标注对信息检索系统性能的影响。笔者在SMART检索系统上使用不同标注集、不同索引项权重进行了检索实验,并对检索结果进行评测。实验表明,在信息检索中加入词性标注信息可能会对某些特定Topic 和Document 的检索效果有所改进,但是词性标注的影响能力弱于索引项权重选择的影响能力。词性标注对检索性能的影响涉及到Topic 和Document 中的具体用词,普遍规律有待进一步研究。

【参考文献】
中国期刊全文数据库 前1条
1 孙宏林,陆勤,俞士汶;利用遗传算法实现词类标记集的优化[J];中文信息学报;2001年01期
【共引文献】
中国硕士学位论文全文数据库 前3条
1 李勇;智能检索中基于本体的个性化用户建模技术及应用[D];国防科学技术大学;2002年
2 徐嘉莉;基于多移动代理系统的个性化数据挖掘系统的研究[D];电子科技大学;2004年
3 安立华;异构分布数据源中基于本体的个性化查询方法研究[D];大连海事大学;2005年
【同被引文献】
中国硕士学位论文全文数据库 前1条
1 崔铮;中西方企业社会责任行为的跨文化比较研究[D];对外经济贸易大学;2006年
【相似文献】
中国期刊全文数据库 前10条
1 刘珺;张文欣;;基于RSS的层次结构用户兴趣模型的分析与设计[J];河南工程学院学报(自然科学版);2011年03期
2 陶惠;张妍;郝光权;;基于向量空间的文档聚类算法分析[J];电脑知识与技术;2011年20期
3 李卫东;陆玲;;融合VSM技术的PageRank算法研究与应用[J];计算机与现代化;2011年07期
4 李虎;邹鹏;贾焰;周斌;;一种基于MapReduce的分布式文本数据过滤模型研究[J];信息网络安全;2011年09期
5 朱培焱;夏栋梁;;汉英跨语言信息检索研究[J];计算机与现代化;2011年08期
6 申莹;徐东平;庞俊;;基于概念的中文博客情感极性聚类分析[J];计算机系统应用;2011年08期
7 潘正高;侯传宇;谈成访;;基于命名实体的Web新闻文本分类方法[J];合肥工业大学学报(自然科学版);2011年08期
8 孙桂煌;;一种基于n-gram短语的文本聚类方法研究[J];现代计算机(专业版);2011年14期
9 夏火松;刘建;;文本相似度视角下的虚拟社区评论的可信性分析[J];现代情报;2011年09期
10 张倩;;依托智能搜索引擎构建档案信息检索系统的策略研究[J];档案与建设;2011年06期
中国重要会议论文全文数据库 前10条
1 苏祺;昝红英;胡景贺;项锟;;词性标注对信息检索系统性能的影响[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
2 曹晶;孙铁利;杨柳;;基于概念向量空间模型的信息检索方法[A];2006年全国理论计算机科学学术年会论文集[C];2006年
3 倪耀群;许洪波;谭婧霞;唐慧丰;程学旗;孟丹;;基于优化维汉双语词典的多语言信息检索系统[A];第六届全国信息检索学术会议论文集[C];2010年
4 林耀燊;李文捷;黄绵辉;;信息检索系统中的自然语言处理[A];复杂巨系统理论·方法·应用——中国系统工程学会第八届学术年会论文集[C];1994年
5 王桐;刘大昕;田迪;孙伟;张万松;;一种改进的XML向量空间模型及其近似匹配算法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
6 高勇;荀恩东;宋柔;;构造自然语言问答系统平台[A];第二届全国学生计算语言学研讨会论文集[C];2004年
7 喻飞;夏晓燕;吴蓉晖;徐成;;基于向量空间模型的信息安全审计系统[A];第二十六届中国控制会议论文集[C];2007年
8 陈浩;何婷婷;代玲;;基于向量空间模型的无导词义消歧[A];第二届全国学生计算语言学研讨会论文集[C];2004年
9 李文波;孙乐;;在查询反馈中改善文档聚类效果的策略研究[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
10 黄萱菁;夏迎炬;吴立德;;基于向量空间模型的文本过滤系统[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
中国重要报纸全文数据库 前10条
1 清华大学计算机系智能技术与系统国家重点实验室 张敏 金奕江;寻“宝”有术[N];计算机世界;2003年
2 ;整合信息资源 提升服务能力[N];中国计算机报;2005年
3 记者 刘安;“全国档案报刊文献及科技成果信息检索系统”通过鉴定[N];中国档案报;2002年
4 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
5 本报记者 武天敏包国俊 本报特约记者 郭瑞宏;在浩瀚信息海洋“导航”[N];解放军报;2007年
6 徐莲芝;24团 农企联手打造无公害农产品基地[N];农民日报;2008年
7 李立红;承钢持续推进多项信息化建设与应用[N];中国冶金报;2008年
8 王伟 史忠植;通用与专业[N];计算机世界;2006年
9 张建华;淄博局企业备案实现100%[N];中国国门时报;2008年
10 通讯员 陈班雄 邹俊 本报记者 于莘明;通向科技巅峰的无名台阶[N];科技日报;2009年
中国博士学位论文全文数据库 前10条
1 马晖男;信息检索中浅层语义模型的研究[D];大连理工大学;2007年
2 熊文新;信息检索Query语言分析[D];北京语言大学;2006年
3 杨为民;基于场论的信息检索模型的研究[D];安徽大学;2007年
4 刘涛;现代信息检索中的文本分类及图像恢复研究[D];北京邮电大学;2006年
5 曲卫民;中文XML信息检索系统的研究[D];中国科学院研究生院(软件研究所);2004年
6 王进;基于本体的语义信息检索研究[D];中国科学技术大学;2006年
7 梁作鹏;面向Web的XML检索关键技术研究[D];东南大学;2005年
8 张毅波;史文结构化信息检索系统的研究与实现[D];中国科学院研究生院(软件研究所);2001年
9 孙道军;文本挖掘预处理相关基础技术分析与应用研究[D];北京邮电大学;2008年
10 邢军;领域本体构造中数据源选取及构造方法的研究[D];大连理工大学;2008年
中国硕士学位论文全文数据库 前10条
1 杨蓓虹;基于企业协作信息网平台的信息检索系统的设计与实现[D];苏州大学;2005年
2 操卫平;基于结构化向量空间模型的中文信息检索系统研究与实现[D];北京工业大学;2008年
3 王艳萍;基于XML的移动信息检索模型研究[D];大连理工大学;2006年
4 陈锐;基于概念图的信息检索查询扩展模型研究与实现[D];西北大学;2009年
5 杨永火;组合向量空间模型和语言模型的信息检索系统[D];天津大学;2006年
6 黄名选;基于完全加权关联规则挖掘的查询扩展研究[D];广西师范大学;2007年
7 丁立恺;基于词关联度的信息检索系统[D];复旦大学;2010年
8 付克志;基于Web的文本信息检索算法的研究[D];大连理工大学;2006年
9 顾鑫;个性化智能信息检索系统研究[D];哈尔滨工程大学;2004年
10 倪良胜;面向海量实时数据信息检索系统的研究与实现[D];东南大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026