收藏本站
《第五届全国信息检索学术会议论文集》2009年
收藏 | 手机打开
二维码
手机客户端打开本文

搜索引擎日志分析:协同推荐还是个性化检索

张志涛  杨沐昀  李生  齐浩亮  宋超  
【摘要】:通过对搜索引擎的日志进行统计分析,可以了解用户使用搜索引擎的规律,挖掘用户的兴趣信息,从而可以提高网络信息检索技术的性能。搜狗是一个中文搜索引擎,本文对搜狗日志中有密切联系的查询、用户和点击3个元素进行了统计分析,着重统计分析了各项之间的相互关系,揭示出用户使用搜索引擎的一些新规律:用户在检索过程中对各大门户网站的关注最多;在一个月的时间内提交少于5个不同查询词的用户占据了93.7%,60%的查询词对应多于两个的用户点击,而且93%的用户点击的URL不会多于10个;文中根据用户对相同查询的点击相同与否这个信息,论证了个性化信息检索的必要性,协同推荐技术只能解决少量用户和查询的检索问题,对于大部分的用户和查询,需要个性化的技术来解决。这一发现对于改进中文搜索引擎的性能有很好的指导意义。

手机知网App
【参考文献】
中国期刊全文数据库 前5条
1 王继民,陈翀,彭波;大规模中文搜索引擎的用户日志分析[J];华南理工大学学报(自然科学版);2004年S1期
2 王建勇,单松巍,雷鸣,谢正茂,李晓明;海量Web搜索引擎系统中用户行为的分布特征及其启示[J];中国科学E辑:技术科学;2001年04期
3 杨文峰,李星;网络搜索引擎的用户查询分析[J];计算机工程;2001年06期
4 王继民;龚笔宏;孟涛;;多任务中文Web查询分析[J];计算机工程;2006年14期
5 窦志成;袁晓洁;何松柏;;大规模中文搜索日志中查询重复性分析[J];计算机工程;2008年21期
【共引文献】
中国期刊全文数据库 前10条
1 卢效峰,郑权;基于用户行为分析的搜索引擎模型[J];北方工业大学学报;2004年03期
2 王知津;韩正彪;周鹏;;电子商务网站顾客信息搜寻行为形成机制研究[J];图书与情报;2011年03期
3 黄晨晖;;面向应用加速的两阶段数据压缩流程[J];电脑开发与应用;2010年09期
4 杨武;唐蓉;任丽芸;;重复网页检测算法综述[J];电脑知识与技术;2010年22期
5 程军,刘斌中;数字图书馆海量文本全文检索系统[J];大学图书馆学报;2002年05期
6 吴建源;;基于BP神经网络的中文分词算法研究[J];佛山科学技术学院学报(自然科学版);2012年02期
7 吴建源;;基于BP神经网络的中文分词算法研究[J];广东培正学院学报;2011年04期
8 何攀;刘露;陈荦;王祖文;;基于用户偏好的地理计算应用检索[J];兵工自动化;2012年10期
9 阎放,张海涛,朱宏谊;GOOGLE搜索引擎PageRank技术的优化[J];情报科学;2002年12期
10 王炼;从用户角度评价网络搜索引擎[J];情报科学;2005年03期
中国重要会议论文全文数据库 前5条
1 王继民;彭波;孟涛;;基于搜索引擎日志发现相近Web查询[A];2005年信息与通信领域博士后学术会议论文集[C];2005年
2 王墨君;齐欧;;搜索引擎中基于磁性隐喻的图形化界面交互方式[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
3 王晓春;杨沐昀;李生;赵铁军;张志涛;;中文搜索引擎日志中查询分析的研究[A];第五届全国信息检索学术会议论文集[C];2009年
4 徐志明;宋毅;冯子威;李生;;一种基于分类的用户兴趣模型[A];第六届全国信息检索学术会议论文集[C];2010年
5 梁敏;解萍;郝向宁;;基于用户查询日志的双级缓存结构设计[A];第十七届全国青年通信学术年会论文集[C];2012年
中国博士学位论文全文数据库 前9条
1 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年
2 程军;基于统计的文本分类技术研究[D];中国科学院研究生院(文献情报中心);2003年
3 张宏斌;信息获取中的两类不确定问题研究[D];华中科技大学;2004年
4 方辉;机械制造信息资源的非规范知识处理技术研究[D];四川大学;2007年
5 马卫东;信息共享动力学及主动服务关键技术研究[D];电子科技大学;2007年
6 陈红涛;基于搜索日志的用户行为研究及应用[D];北京邮电大学;2008年
7 翟海军;面向Web信息检索的知识挖掘[D];中国科学技术大学;2010年
8 朱鲲鹏;基于Web日志挖掘的智能信息检索研究[D];哈尔滨工业大学;2009年
9 段瑞雪;基于依存关系的用户意图的研究[D];北京邮电大学;2011年
中国硕士学位论文全文数据库 前10条
1 周志辉;基于用户兴趣模型的个性化搜索引擎研究与分析[D];江西理工大学;2010年
2 沈益舒;搜索语句的时间属性研究及其在检索排序中的应用[D];浙江大学;2011年
3 张盛蕾;基于Java的浙江纺织服装学院校园网搜索引擎[D];电子科技大学;2010年
4 詹圣君;基于用户行为日志分析的搜索引擎排序算法研究[D];湖北工业大学;2011年
5 陈凯;搜索引擎有关排序算法研究[D];武汉理工大学;2011年
6 冯芳芳;网络环境下高校应届本科毕业生就业信息查寻行为研究[D];西南大学;2011年
7 胡壁;语义标记在搜索引擎中应用的研究[D];北京邮电大学;2011年
8 孙丽;分布式全文索引技术的研究[D];哈尔滨工业大学;2010年
9 熊芬;品牌信息搜索推荐研究[D];华中科技大学;2010年
10 胡阳;中文搜索引擎用户检索习惯问卷调查分析[D];河北大学;2011年
【二级参考文献】
中国重要会议论文全文数据库 前1条
1 余慧佳;刘奕群;张敏;茹立云;马少平;;基于大规模日志分析的网络搜索引擎用户行为研究[A];第三届学生计算语言学研讨会论文集[C];2006年
【相似文献】
中国期刊全文数据库 前10条
1 赵修文;吕大军;;Nutch中文分词插件的编写与配置[J];科技信息(学术研究);2007年27期
2 徐伟革;;浅析数字图书馆搜索引擎[J];科技情报开发与经济;2010年20期
3 方亚会;;Google失败后快速切换搜索引擎[J];电脑迷;2011年11期
4 王政平;;Google搜索秘笈123[J];互联网天地;2005年08期
5 陈春阳;;对互联网搜索引擎的初步认识[J];硅谷;2009年10期
6 ;搜索:更快、更准、更简单[J];中小学信息技术教育;2006年03期
7 ;版权仍旧是问题[J];每周电脑报;2000年34期
8 蔡建超;郭一平;王亮;;基于Lucene.Net校园网搜索引擎的设计与实现[J];计算机技术与发展;2006年11期
9 ;商业搜索拉开大幕 Autonomy力挺Ultraseek5.7[J];中国金融电脑;2006年12期
10 张俊丽;高劲松;张帆;;基于网格的国外搜索引擎系统的比较研究[J];现代图书情报技术;2007年09期
中国重要会议论文全文数据库 前10条
1 张志涛;杨沐昀;李生;齐浩亮;宋超;;搜索引擎日志分析:协同推荐还是个性化检索[A];第五届全国信息检索学术会议论文集[C];2009年
2 余慧佳;刘奕群;张敏;茹立云;马少平;;基于大规模日志分析的网络搜索引擎用户行为研究[A];第三届学生计算语言学研讨会论文集[C];2006年
3 彭轲;廖闻剑;;浅析搜索引擎[A];中国通信学会第五届学术年会论文集[C];2008年
4 陈杰;;应用智能搜索 实现数据挖掘[A];中国新闻技术工作者联合会五届一次理事会暨学术年会论文集(上篇)[C];2009年
5 邓长寿;郭景峰;杨焱林;邓安远;;下一代Web搜索引擎初探[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
6 倪俊峰;;基于黄页搜索引擎的关键字排名广告系统的设计与实现[A];2005年中国索引学会年会暨学术研讨会论文集[C];2005年
7 张怡;查贵庭;;SEO在信息服务中的应用研究[A];2010年中国索引学会年会暨学术研讨会论文集[C];2010年
8 陈援非;何哲;朱珍民;;基于普适计算的个性化搜索技术[A];第二届和谐人机环境联合学术会议(HHME2006)——第2届中国普适计算学术会议(PCC'06)论文集[C];2006年
9 杨萌;李春丽;朱明;;网络搜索技术下的编辑工作[A];学报编辑论丛(第十一集)[C];2003年
10 陈磊;茹立云;马少平;;基于用户日志挖掘的搜索引擎广告效果分析[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
中国重要报纸全文数据库 前10条
1 博文译;你的隐私 搜索引擎知道[N];计算机世界;2007年
2 杨洁;搜索引擎营销市场生变[N];中国计算机报;2007年
3 刘文君;搜索引擎也在寻求创新[N];大众科技报;2007年
4 ;法国挑战谷歌推出卫星地图搜索引擎[N];人民日报;2006年
5 MirrorCity.net技术总监 姚浩;让搜索引擎回归最初梦想[N];中国文化报;2008年
6 本报记者 操秀英;国双科技以技术加服务赢得市场[N];科技日报;2009年
7 赵敏;“鱼群理论”破解搜索营销谜局[N];中国企业报;2007年
8 本报记者 樊哲高;搜索引擎三国纷争 中文市场两军对垒[N];中国电子报;2009年
9 EndTo;优化Meta讨好搜索引擎[N];电脑报;2009年
10 本报记者 马文方;Yebol:从思维科学导出搜索引擎[N];中国计算机报;2010年
中国博士学位论文全文数据库 前10条
1 岑荣伟;基于用户行为分析的搜索引擎评价研究[D];清华大学;2010年
2 李群;主题搜索引擎聚类算法的研究[D];北京林业大学;2011年
3 苏君华;面向搜索引擎的技术接受模型研究[D];南京大学;2011年
4 刘佐达;分布协作式搜索引擎模型及算法研究[D];清华大学;2011年
5 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年
6 郭眈;中文互联网视频搜索引擎系统策略研究[D];北京交通大学;2012年
7 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年
8 白玉琪;空间信息搜索引擎研究[D];中国科学院研究生院(遥感应用研究所);2003年
9 费巍;搜索引擎检索功能的性能评价研究[D];武汉大学;2010年
10 黄河;农业复杂自适应搜索模型研究及实现[D];中国科学技术大学;2010年
中国硕士学位论文全文数据库 前10条
1 刘辉;搜索引擎联邦算法设计与系统实现[D];清华大学;2004年
2 王春花;基于Nutch的农业搜索引擎检索结果排序策略的研究[D];西北农林科技大学;2010年
3 李雷;基于Nutch的农业信息搜索引擎实现和优化[D];吉林大学;2011年
4 董晨;基于模糊聚类的个性化搜索引擎的研究[D];福州大学;2005年
5 封俊;基于Hadoop的分布式搜索引擎研究与实现[D];太原理工大学;2010年
6 李浩;分布式教育网信息检索系统的研究和实现[D];华南理工大学;2010年
7 尉建兴;基于Lucene搜索引擎的研究与应用[D];太原理工大学;2011年
8 欧建斌;基于Web挖掘与信息分类的个性化搜索引擎研究[D];暨南大学;2010年
9 张朝斌;企业级搜索引擎的优化设计与实现[D];华南理工大学;2010年
10 杨晓丹;基于Lucene的主题搜索引擎模板的设计与实现[D];浙江工商大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026