收藏本站
《第三届学生计算语言学研讨会论文集》2006年
收藏 | 手机打开
二维码
手机客户端打开本文

一种基于HTML位置信息的查询扩展技术

陈志玮  肖诗斌  施水才  王昕  
【摘要】:查询扩展是指对用户提供的有关实体属性查询的描述进行语义上同义或近义方面的扩展。针对信息检索中文档与查询之间的词不匹配问题,本文提出一种基于HTML位置信息的查询扩展方法。由于HTML文件中存在位置信息(即Tag标签信息),所以,选择HTML文件进行查询扩展,相对于选择纯文本文件来说效果更好。本文中利用现有的各大搜索引擎的搜索结果组成训练语料,且利用词项与所有查询词在局部文档集合中的共现程度来评估扩展词的质量。最后,使用标准的向量空间模型(VSM)作为检索算法,将使用位置信息进行查询扩展与不加查询扩展及使用查询扩展的效果进行比对。该查询扩展技术对于查询短小、文档集内容比较分散的情况应尤为适用,可以极大地提高查询效果。同时,利用HTML中的位置信息,能够更好得对查询进行扩展。

手机知网App
【参考文献】
中国期刊全文数据库 前1条
1 崔航,文继荣,李敏强;基于用户日志的查询扩展统计模型[J];软件学报;2003年09期
中国重要会议论文全文数据库 前1条
1 丁国栋;白硕;王斌;;一种基于局部共现的查询扩展方法[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
【共引文献】
中国期刊全文数据库 前10条
1 李玉鑑;操卫平;周兰珍;;结构化向量空间模型及其在Web信息检索中的应用[J];北京工业大学学报;2008年04期
2 余正涛,樊孝忠,宋丽荣;基于特定问题类别的汉语问答系统查询扩展[J];北京理工大学学报;2005年10期
3 吴锐;丁树良;甘登文;;一种新的项目反应理论等值准则——余弦准则[J];江西师范大学学报(自然科学版);2008年02期
4 尚福华;韩开旭;;基于相关术语群和同义词的查询扩展研究[J];长江大学学报(自然科学版)理工卷;2010年03期
5 罗金增;;基于模糊聚类的个性化Web信息检索系统研究[J];电脑知识与技术;2005年35期
6 易爱平;廖祝华;张惠;;基于Google的个性化搜索系统的设计与实现[J];电脑知识与技术(学术交流);2007年01期
7 盛魁;赵鹏;;中文网页自动分类综述[J];电脑知识与技术;2010年27期
8 赵玉茗;徐志明;王晓龙;朱鲲鹏;;基于词汇集聚的文档相关性计算[J];电子与信息学报;2008年10期
9 程华;;基于特征提取的中文检索方法研究[J];福建电脑;2006年12期
10 陈英傑;;本体对传统向量空间模型的改进[J];经营管理者;2009年15期
中国重要会议论文全文数据库 前10条
1 王凯;刘代志;李东旭;齐玮;;地球物理环境情报搜集系统研究[A];国家安全地球物理丛书(四)——地球物理环境探测和目标信息获取与处理[C];2008年
2 顾寄南;陈晓燕;;检索系统专业化和智能化的研究与实现[A];走中国特色农业机械化道路——中国农业机械学会2008年学术年会论文集(下册)[C];2008年
3 张威;张博刚;廖飞雄;陈月宁;;基于软件运行记录的交互测试研究[A];第六届中国测试学术会议论文集[C];2010年
4 王洪俊;赖志国;施水才;肖诗斌;;基于查询日志的查询建议挖掘[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
5 盛俊;王明文;余俊英;;一种基于潜在语义的Markov网络信息检索模型[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
6 徐小琴;章成志;;Web信息检索中相关词提示技术与评测[A];第三届学生计算语言学研讨会论文集[C];2006年
7 章成志;苏兰芳;;基于多语境的相关词自动提取[A];第三届学生计算语言学研讨会论文集[C];2006年
8 刘悦;许洪波;程学旗;;互联网挖掘和搜索的研究进展[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
9 吴京慧;余珊珊;王明文;;基于用户日志聚类的查询扩展模型[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
10 李东园;白宇;蔡东风;;基于用户日志分析的查询扩展研究[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
中国博士学位论文全文数据库 前10条
1 刘朝涛;中文问答系统中的句型理论及其应用研究[D];重庆大学;2010年
2 邸书灵;Agent联盟和流形学习在中文问答系统中的应用研究[D];天津大学;2009年
3 李智;机器学习方法及其在基金项目评审中的应用研究[D];天津大学;2004年
4 郭岩;网络日志中用户兴趣的挖掘及利用[D];中国科学院研究生院(计算技术研究所);2004年
5 刘伟;图像检索中若干问题的研究[D];浙江大学;2007年
6 蔡柯柯;基于查询特征上下文的检索模型研究[D];浙江大学;2007年
7 刘书暖;工艺知识发现与重用技术[D];西北工业大学;2007年
8 田萱;基于上下文的信息检索关键技术研究[D];中国人民大学;2007年
9 周健;结构化对等网络中的关键技术研究[D];中国科学技术大学;2008年
10 吴陈;粒和粗集研究及与证据理论相结合在不完备数据处理中的应用[D];南京理工大学;2007年
中国硕士学位论文全文数据库 前10条
1 吕晨;搜索竞价广告关键词优化问题研究[D];山东科技大学;2010年
2 雷斌;基于Java技术的智能化搜索引擎的研究与设计[D];哈尔滨工程大学;2010年
3 李健;基于内容的新闻视频检索关键技术研究[D];哈尔滨理工大学;2010年
4 吕靖;互联网搜索词分类关键技术研究[D];浙江大学;2011年
5 周剑烽;基于语义本体的信息检索方法的研究[D];杭州电子科技大学;2010年
6 樊瑞;民用飞机软件验证技术研究[D];南京航空航天大学;2010年
7 范敏敏;企业经营范围字段自动分类方法研究[D];哈尔滨工业大学;2010年
8 彭璐;基于拼音标注的中文分词算法研究[D];华中科技大学;2010年
9 谭利文;基于用户模型的个性化网络文献检索系统的研究与设计[D];吉林大学;2004年
10 付雪峰;基于模糊—粗糙集的文本分类模型[D];江西师范大学;2005年
【二级参考文献】
中国博士学位论文全文数据库 前1条
1 张华平;语言浅层分析与句子级新信息检测研究[D];中国科学院研究生院(计算技术研究所);2005年
中国硕士学位论文全文数据库 前1条
1 杨哲;提高信息检索性能的有效机制与算法研究[D];中国科学院研究生院(计算技术研究所);2004年
【相似文献】
中国期刊全文数据库 前10条
1 黄名选;朱家安;冯平;;基于正负关联规则融合的信息检索模型[J];情报理论与实践;2011年07期
2 ;第七届全国信息检索学术会议(CCIR 2011)征文通知[J];模式识别与人工智能;2011年03期
3 黄名选;马瑞兴;兰慧红;;面向查询扩展的特征词频繁项集挖掘算法[J];现代图书情报技术;2011年04期
4 黄名选;朱家安;陈燕红;;面向查询扩展的词间正负关联规则挖掘算法[J];计算机工程与应用;2011年26期
5 张文慧;张冉;;基于中文分词的农业信息检索平台设计[J];安徽农业科学;2011年20期
6 顾小林;卞艺杰;浦徐进;;基于改进KS方法的食品安全追溯信息检索模型[J];软科学;2011年08期
7 杨永健;;浅议图书馆新型OPAC系统发展趋势——以汇文OPAC系统为例[J];四川图书馆学报;2011年03期
8 刘劲松;张彬;柴文磊;魏建行;刘振鹏;;校园网园区搜索引擎的设计与实现[J];河北大学学报(自然科学版);2011年04期
9 徐建民;陈振亚;;一种用于结构化文档检索的贝叶斯网络[J];计算机工程;2011年13期
10 谢根甲;王昊;;全国民办高校综合检索数据库建设与构想[J];兰台世界;2011年15期
中国重要会议论文全文数据库 前10条
1 陈志玮;肖诗斌;施水才;王昕;;一种基于HTML位置信息的查询扩展技术[A];第三届学生计算语言学研讨会论文集[C];2006年
2 王秉卿;张奇;吴立德;黄萱菁;;机器学习的查询扩展在博客检索中的应用[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
3 刘全升;姚天昉;;基于关联度模型的文本倾向性检索研究[A];第六届全国信息检索学术会议论文集[C];2010年
4 丁国栋;白硕;王斌;;一种基于局部共现的查询扩展方法[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
5 周博;岑荣伟;刘奕群;张敏;马少平;;相关反馈任务中一种基于文档相似度的检索结果重排序方法[A];第五届全国信息检索学术会议论文集[C];2009年
6 张磊;王斌;靖红芳;吴丽辉;;中文网页搜索日志中的特殊命名实体挖掘[A];第五届全国信息检索学术会议论文集[C];2009年
7 罗伟;李陶深;;一种基于本体的个性化搜索引擎模型[A];广西计算机学会2006年年会论文集[C];2006年
8 ;编者的话[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
9 米晓红;;一种基于LSI的用户兴趣模型构建方法[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)[C];2006年
10 王敬成;;HNC农村智能信息检索系统[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
中国重要报纸全文数据库 前10条
1 希安;微软试水信息检索[N];经济日报;2004年
2 本报记者 潘永花;组件化平台提升信息检索效率[N];网络世界;2003年
3 柏荣;国家973项目在因特网大规模信息检索领域取得突破[N];中国高新技术产业导报;2003年
4 微软中国研究院 陈正 李明镜 马维英;互联网上图像信息检索[N];计算机世界;2001年
5 于振海;Microsoft Office 2003的翻译服务你用了吗?[N];中国电脑教育报;2004年
6 高丽华;信息化遭遇新雷区[N];计算机世界;2007年
7 李茂 编译;创新是技术素养的第一要求[N];中国教师报;2007年
8 涂序彦 陈泓娟;在网络信息海洋中淘金[N];计算机世界;2001年
9 西安 张树忠 时剑;如何使用Word 2003翻译功能[N];电子报;2004年
10 清华大学计算机系智能技术与系统国家重点实验室 张敏 金奕江;“海”中捞“珍”[N];计算机世界;2003年
中国博士学位论文全文数据库 前10条
1 仲兆满;事件本体及其在查询扩展中的应用[D];上海大学;2011年
2 张毅波;史文结构化信息检索系统的研究与实现[D];中国科学院研究生院(软件研究所);2001年
3 林建方;词搭配抽取及在信息检索中的应用研究[D];哈尔滨工业大学;2010年
4 王一川;基于内容的海量文本探索式查询导引中若干关键技术的研究[D];北京邮电大学;2011年
5 蒲强;基于独立分量分析的语义聚类技术在信息检索中的应用研究[D];电子科技大学;2010年
6 丁国栋;基于统计语言建模的信息检索及相关研究[D];中国科学院研究生院(计算技术研究所);2006年
7 张华平;语言浅层分析与句子级新信息检测研究[D];中国科学院研究生院(计算技术研究所);2005年
8 董道国;高维数据索引结构研究[D];复旦大学;2005年
9 翟海军;面向Web信息检索的知识挖掘[D];中国科学技术大学;2010年
10 郭永明;XML文档交互式信息检索技术研究[D];东华大学;2010年
中国硕士学位论文全文数据库 前10条
1 周剑烽;基于语义本体的信息检索方法的研究[D];杭州电子科技大学;2010年
2 罗建利;基于用户兴趣的概念查询扩展研究[D];扬州大学;2005年
3 王水利;基于互信息的语义查询扩展技术研究[D];河南科技大学;2011年
4 刘清江;同义词在文本特征提取与查询扩展中的应用[D];河北大学;2010年
5 方勇;基于语义的信息检索方法研究与应用[D];浙江大学;2010年
6 吕芳芳;基于查询扩展的垂直搜索研究[D];山东科技大学;2010年
7 崔琰;基于用户兴趣及术语关系的查询扩展方法[D];河北大学;2011年
8 方芳;中文信息检索系统与文档重排技术研究[D];武汉科技大学;2010年
9 胡珍新;面向用户的查询扩展研究与实现[D];江西师范大学;2004年
10 范丹;Web检索中的查询扩展及结果聚类技术研究[D];辽宁师范大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026