收藏本站
《中国计算语言学研究前沿进展(2009-2011)》2011年
收藏 | 手机打开
二维码
手机客户端打开本文

基于维基百科层次分类框架的主题推荐系统的研究

谢科  刘奕群  岑荣伟  马少平  茹立云  杨磊  
【摘要】:在用户使用互联网的过程中,并不一定经常持有明确的目的性,比如浏览新闻网站时用户可能会被各种不同主题的新闻链接所吸引。但是总体来说,特定用户的兴趣在一段时期内来讲,是趋于固定的。如果能在用户点击日志中,识别其可能感兴趣的主题,同时预测其感兴趣的其他主题或条目,可以帮助用户"探索"他们可能感兴趣的内容。随着推荐系统领域的发展,电影推荐以及音乐推荐已趋近成熟,但此类研究多是建立在已有数据集上,从来没有过对用户点击行为进行分析并做出浏览推荐的研究。本文作者从某浏览器点击记录中,提取出部分用户的浏览记录,分析并整理为实验所用的数据集。同时,我们提出了一种简单有效的框架,即通过对用户点击链接文本的分析,利用汉语维基百科建立索引并分析用户的兴趣,采用协同过滤算法预测用户可能感兴趣的其他主题。通过实验,我们的推荐框架可以较好地描述用户兴趣,即使用简单的协同过滤算法也可以达到良好效果。同时我们的算法运算速度快,可对用户兴趣发掘、文本分类及协同过滤相关的研究领域产生一定的指导意义。

【相似文献】
中国期刊全文数据库 前10条
1 张成;曲明成;倪宁;仇光;卜佳俊;;基于概率潜在语义分析模型的自动答案选择[J];计算机工程;2011年14期
2 闫洲;石刘红;;基于用户和项目组合的协同过滤推荐算法[J];电脑知识与技术;2011年16期
3 杨东风;;基于多兴趣度的图书借阅推荐系统研究与设计[J];信息技术;2011年07期
4 田晶华;李翠平;陈红;;基于类标签聚类的动态问题分类集成学习算法[J];计算机科学与探索;2011年09期
5 李金厚;周丽平;于晓青;;基于用户操作行为的兴趣度的分析与计算[J];工业控制计算机;2011年07期
6 陆虹;;一种基于本体论的个性化网络信息检索模型[J];河南图书馆学刊;2011年04期
7 田萱;李冬梅;;上下文信息检索研究综述[J];计算机科学;2011年09期
8 卢晓慧;桑世庆;;基于J2EE框架的高校创业信息服务平台的构建[J];科技通报;2011年04期
9 赵华;林政;方艾;杨翊平;;一种基于知识树的推荐算法及其在移动电子商务上的应用[J];电信科学;2011年06期
10 傅鹤岗;李冉;;基于用户实时反馈的协同过滤算法[J];计算机应用;2011年07期
中国重要会议论文全文数据库 前10条
1 周毅;江云亮;张铭;熊宇红;冯是聪;;基于“链接”层次分类的主题爬取[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
2 谢科;刘奕群;岑荣伟;马少平;茹立云;杨磊;;基于维基百科层次分类框架的主题推荐系统的研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 ;平方爱索互联网智能信息系统[A];中国中文信息学会第六次全国会员代表大会暨成立二十五周年学术会议中文信息处理重大成果汇报展资料汇编[C];2006年
4 文勖;张宇;刘挺;;类别主特征结合句法特征的中文问题层次分类[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
5 孙静;郭奇;张志强;冯建华;;一种基于面向领域检索系统的用户兴趣获取方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
6 张健沛;李连江;杨静;;个性化搜索引擎排序算法的研究与改进[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
7 田萱;杜小勇;;基于SAM模型的用户兴趣表示研究[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
8 张玉连;陈琳娜;陈金森;;基于本体的个性化服务用户模型研究[A];第二届和谐人机环境联合学术会议(HHME2006)——第2届中国普适计算学术会议(PCC'06)论文集[C];2006年
9 罗伟;李陶深;;一种基于本体的个性化搜索引擎模型[A];广西计算机学会2006年年会论文集[C];2006年
10 宋丽哲;詹赤兵;王胜海;;基于本体的数字图书馆个性化用户模型表示[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国重要报纸全文数据库 前4条
1 张敏;谁的资产谁不爱[N];网络世界;2006年
2 Eric Newcomer;分布式SOA崭露头角[N];计算机世界;2007年
3 郝莉;个性化数字图书馆[N];网络世界;2003年
4 刘丽丽;“云”是最大的“中间件”[N];计算机世界;2010年
中国博士学位论文全文数据库 前10条
1 李志国;面向分布式文本知识管理的中文分词与文本分类研究[D];重庆大学;2008年
2 袁时金;信任管理关键技术研究[D];复旦大学;2005年
3 罗娜;基于本体的主题爬行技术研究[D];吉林大学;2009年
4 潘建国;基于语义的用户建模技术与应用研究[D];上海大学;2009年
5 熊云波;文本信息处理的若干关键技术研究[D];复旦大学;2006年
6 杜阿宁;互联网舆情信息挖掘方法研究[D];哈尔滨工业大学;2007年
7 刘东飞;智能双语搜索方法及搜索引擎的研究[D];武汉理工大学;2009年
8 王灿;基于半监督流形学习的Web信息检索技术研究[D];浙江大学;2009年
9 马建国;具有内容标引的信息共享技术[D];电子科技大学;2004年
10 郭岩;网络日志中用户兴趣的挖掘及利用[D];中国科学院研究生院(计算技术研究所);2004年
中国硕士学位论文全文数据库 前10条
1 张璇;基于用户兴趣的个性化搜索引擎技术研究[D];湖南大学;2010年
2 于芳;面向用户兴趣的Web搜索策略的研究与实现[D];东北大学;2008年
3 邱春艳;基于粗糙集理论的智能信息检索方法的研究[D];东北师范大学;2005年
4 罗建利;基于用户兴趣的概念查询扩展研究[D];扬州大学;2005年
5 崔琰;基于用户兴趣及术语关系的查询扩展方法[D];河北大学;2011年
6 郑泓;个性化信息服务实现方法的研究[D];重庆大学;2002年
7 樊康新;基于服务器端的个性化元搜索引擎的研究与设计[D];苏州大学;2005年
8 王楠;基于用户兴趣的虚拟会展平台研究[D];浙江大学;2008年
9 邓晓嘉;一种基于RSS用户兴趣的个性化搜索系统[D];北京工业大学;2010年
10 和雪芳;基于移动Agent的个性化信息检索技术研究[D];西安理工大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026