收藏本站
《第一届学生计算语言学研讨会论文集》2002年
收藏 | 手机打开
二维码
手机客户端打开本文

基于兴趣模型的WEB信息预测采集过滤方法

李振星  徐泽平  
【摘要】:Web网上海量信息急速膨胀使得有效定向采集相关信息检索成为网上信息查询一个日益重要的研究方向。本文提出一种基于用户兴趣模型的Web文本信息预测采集过滤方法。这种方法根据正反集文本过滤方法,设计出一种用户兴趣模型,并在对Web站点结构进行分析的基础之上,通过对网页的相关度的预测来控制信息的采集。在保持定向采集精度的同时,缩短采集时间、减少存储、加快检索,节约了网络资源。

【相似文献】
中国期刊全文数据库 前10条
1 王静;孔飞;张洪峰;刘艳;吴晓民;;陕西哺乳动物Web信息系统构建初探[J];西北大学学报(自然科学版);2011年03期
2 周聚;李培峰;朱巧明;;一种基于二元模型的分层文本过滤方法[J];计算机应用与软件;2011年07期
3 ;六招小技巧帮你设置好傲游浏览器[J];计算机与网络;2010年01期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 李振星;徐泽平;;基于兴趣模型的WEB信息预测采集过滤方法[A];第一届学生计算语言学研讨会论文集[C];2002年
2 赵林;夏迎炬;黄萱菁;吴立德;;基于Winnow算法的文本过滤[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
3 黄萱菁;夏迎炬;吴立德;;基于向量空间模型的文本过滤系统[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
4 李盛韬;吴丽辉;于满泉;潘文锋;余智华;王斌;程学旗;;主题Web信息采集的研究与设计[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
5 吴立德;黄萱菁;;文本检索会议简介[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
6 朱祥玉;侯德文;陈希;;基于双重评估函数的文本特征提取方法[A];山东省计算机学会2005年信息技术与信息化研讨会论文集(二)[C];2005年
7 张敏;马亮;马少平;陈群秀;;TREC2002介绍及清华大学实验研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
8 黄晓宏;连理;夏迎炬;徐国伟;;基于规则和非规则方法的WEB信息提取[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
9 李东林;迟呈英;战学刚;;一个改进的中文文本过滤系统的设计与实现[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
10 张刚;刘挺;秦兵;车万翔;李生;;面向信息内容安全的文本过滤系统研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
中国重要报纸全文数据库 前10条
1 解树江;电子商务的内容及优势[N];中国汽车报;2000年
2 编译 王辉;怎样选择共同基金[N];上海金融报;2005年
3 唐;IBM强化Linux策略[N];中国计算机报;2000年
4 ;3RSoft产品聚焦[N];中国计算机报;2003年
5 涂序彦 陈泓娟;在网络信息海洋中淘金[N];计算机世界;2001年
6 ;Web收获:吸纳有用信息[N];计算机世界;2004年
7 军军;奶酪还是鸡肋?[N];中国电脑教育报;2004年
8 龙哥;操作系统问答!(二)[N];中国计算机报;2004年
9 ;商业智能工具帮助企业正确决策[N];计算机世界;2002年
10 记者 徐建华;“绿色上网”新标准为手机扫黄[N];中国质量报;2010年
中国博士学位论文全文数据库 前10条
1 夏迎炬;文本过滤关键技术研究[D];复旦大学;2003年
2 朱振方;基于微粒群和遗传优化的文本过滤关键技术研究[D];山东师范大学;2012年
3 郑淑丽;Web信息集成系统及查询优化方法研究[D];合肥工业大学;2003年
4 刘永丹;文档数据库若干关键技术研究[D];复旦大学;2004年
5 程军;基于统计的文本分类技术研究[D];中国科学院研究生院(文献情报中心);2003年
6 赵玉茗;文本间语义相关性计算及其应用研究[D];哈尔滨工业大学;2009年
7 吴江;基于本体的知识管理系统关键技术研究[D];西北大学;2007年
8 张凯;基于本体的Web信息集成若干关键技术研究[D];复旦大学;2004年
9 毛军;Web信息服务中受控语言研究[D];中国科学院研究生院(文献情报中心);2002年
10 俞方桦;互联网信息资源整合研究[D];东华大学;2001年
中国硕士学位论文全文数据库 前10条
1 刘力;不良文本过滤系统的研究与实现[D];复旦大学;2011年
2 周聚;基于网络信息审计的文本过滤的研究与实现[D];苏州大学;2010年
3 邵建双;基于概念格的文本过滤系统的设计与实现[D];大连海事大学;2010年
4 孙浩;基于主动学习的文本过滤系统的研究[D];北京邮电大学;2011年
5 汪前秀;基于改进的VSM的不良文本过滤模型研究[D];东北财经大学;2010年
6 李霞;文本过滤防火墙技术研究[D];北方工业大学;2011年
7 张磊;虚拟社区不良信息过滤技术研究[D];昆明理工大学;2011年
8 张明锋;基于数据仓库和OLAP的福建省气候WEB信息系统研究[D];福建师范大学;2001年
9 岑咏华;科技信息门户网站的技术研究[D];南京理工大学;2003年
10 王立建;中文web文本过滤技术研究[D];中北大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026