收藏本站
《计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集》2007年
收藏 | 手机打开
二维码
手机客户端打开本文

Web文本挖掘研究

武洪萍  周国祥  
【摘要】:WWW是一个巨大的、分布广泛的、全球性的信息服务中心,它包含了丰富的信息资源。Web挖掘可以快速有效地获取所需要的信息。Web文本挖掘是Web挖掘中的重要组成部分。本文重点探讨了Web文本挖掘中文本预处理,特征提取、文本分类及文本聚类等关键实现技术,最后讨论了Web文本挖掘的价值及发展的重要性。

【参考文献】
中国期刊全文数据库 前8条
1 张蓉;;Web挖掘技术研究[J];计算机工程;2006年15期
2 袁军鹏;朱东华;李毅;李连宏;黄进;;文本挖掘技术研究进展[J];计算机应用研究;2006年02期
3 庞景安;;Web文本特征提取方法的研究与发展[J];情报理论与实践;2006年03期
4 张宏松;刘建辉;;面向Web的文本信息挖掘研究[J];计算机系统应用;2006年09期
5 许建潮,胡明;中文Web文本的特征获取与分类[J];计算机工程;2005年08期
6 李颖,阎保平;Web文本挖掘在互联网信息统计中的研究与设计[J];微电子学与计算机;2005年01期
7 苏芳仲,林世平;Web文本挖掘中的一种中文分词算法研究及其实现[J];福州大学学报(自然科学版);2004年S1期
8 和亚丽,陈立潮;Web文本挖掘中的特征选取方法研究[J];计算机工程;2005年05期
【共引文献】
中国期刊全文数据库 前5条
1 王圆;孙铁利;李杨;;Web文本挖掘中的特征表示和特征提取[J];电脑知识与技术;2006年14期
2 王艳;张帆;杨炳儒;;基于Web挖掘的数字图书馆个性化技术研究[J];情报杂志;2007年01期
3 李辉;乔晓东;;基于科技文献的技术机会分析方法初探[J];情报杂志;2007年05期
4 化柏林;赵亮;;知识抽取中的嵌套向量分词技术[J];现代图书情报技术;2007年07期
5 张文;唐锡晋;;基于Web内容挖掘的信息支持工具AIS-GAE[J];管理评论;2006年09期
中国重要会议论文全文数据库 前1条
1 杜志文;曾文华;;网格计算在文本分类中的应用[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年
中国博士学位论文全文数据库 前4条
1 王煜;基于决策树和K最近邻算法的文本分类研究[D];天津大学;2006年
2 方辉;机械制造信息资源的非规范知识处理技术研究[D];四川大学;2007年
3 易明;基于Web挖掘的电子商务个性化推荐机理与方法研究[D];华中科技大学;2006年
4 尹世群;Web文本分类关键技术研究[D];西南大学;2008年
中国硕士学位论文全文数据库 前10条
1 杨铭;数据挖掘技术在专利信息分析与预测中的应用研究[D];武汉理工大学;2006年
2 田海燕;基于主题地图的文献组织方法研究[D];大连理工大学;2006年
3 王圆;文本内容过滤的关键技术研究[D];东北师范大学;2006年
4 唐明;文本挖掘及其在多文化交流平台中的应用[D];西南大学;2006年
5 邹庆轩;基于关联规则的文本数据挖掘研究[D];西南石油大学;2006年
6 宋爽;共现分析在文本知识挖掘中的应用研究[D];南京理工大学;2006年
7 周俊;生物医学文本挖掘及其在基因调控信息分析中的应用[D];东南大学;2006年
8 尚旭祥;基于关联的中文文本分类系统的设计与实现[D];解放军信息工程大学;2006年
9 张超林;文本分类技术在数字图书馆中的应用与研究[D];首都师范大学;2007年
10 王俊英;基于科技文献的中文文本分类算法研究[D];燕山大学;2007年
【同被引文献】
中国期刊全文数据库 前10条
1 苏芳仲,林世平;Web文本挖掘中的一种中文分词算法研究及其实现[J];福州大学学报(自然科学版);2004年S1期
2 张绍华,徐林昊,杨文柱,薛文玲,李天柱;基于样本实例的Web信息抽取[J];河北大学学报(自然科学版);2001年04期
3 王继成,潘金贵,张福炎;Web文本挖掘技术研究[J];计算机研究与发展;2000年05期
4 许建潮,侯锟;Web信息的自主抽取方法[J];计算机工程与应用;2005年14期
5 周源远,王继成,郑刚,张福炎;Web页面清洗技术的研究与实现[J];计算机工程;2002年09期
6 沈记全,唐菁,杨炳儒;Web文本挖掘系统及其分类算法的研究与实现[J];计算机工程;2003年17期
7 张蓉;;Web挖掘技术研究[J];计算机工程;2006年15期
8 贡正仙;朱巧明;李培峰;;基于相似页面的Web信息抽取系统的实现[J];计算机应用;2006年08期
9 袁军鹏;朱东华;李毅;李连宏;黄进;;文本挖掘技术研究进展[J];计算机应用研究;2006年02期
10 刘强;MFC中RTTI技术实现的研究[J];微机发展;2003年S1期
【二级参考文献】
中国期刊全文数据库 前10条
1 唐晓文;基于本体论的文本特征提取[J];电脑与信息技术;2005年01期
2 马颖华,王永成,苏贵洋,韩客松,赵海;自动标引中基于概念层次树的主题词轮排选择的算法实现[J];高技术通讯;2003年06期
3 林鸿飞,战学刚,姚天顺;基于概念的文本结构分析方法[J];计算机研究与发展;2000年03期
4 王继成,潘金贵,张福炎;Web文本挖掘技术研究[J];计算机研究与发展;2000年05期
5 陆玉昌,鲁明羽,李凡,周立柱;向量空间法中单词权重函数的分析和构造[J];计算机研究与发展;2002年10期
6 晋耀红,苗传江;一个基于语境框架的文本特征提取算法[J];计算机研究与发展;2004年04期
7 邹涛,王继成,朱华宇,金翔宇,张福炎;WWW上的信息挖掘技术及实现[J];计算机研究与发展;1999年08期
8 胥桂仙,苏筱蔚,陈淑艳;中文文本挖掘中的无词典分词的算法及其应用[J];吉林工学院学报(自然科学版);2002年01期
9 李振星,徐泽平,唐卫清,唐荣锡;全二分最大匹配快速分词算法[J];计算机工程与应用;2002年11期
10 万敏,罗振声,季姮,高小云;基于概念统计的英文自动文摘研究[J];计算机工程与应用;2002年24期
中国硕士学位论文全文数据库 前1条
1 唐飞龙;Internet信息获取技术的研究[D];合肥工业大学;2002年
【相似文献】
中国期刊全文数据库 前10条
1 韦妍;;人脸表情识别概述[J];网络安全技术与应用;2011年08期
2 吴春辉;陈洪生;;基于内容的音频检索技术研究[J];咸宁学院学报;2011年06期
3 刘劲;陈瑛琦;扶晓;;虹膜特性提取阶段的小波多尺度特征量化算法[J];电脑编程技巧与维护;2011年14期
4 贾志先;;基于支持向量机的空白试卷识别方法[J];山西大学学报(自然科学版);2011年03期
5 胡进;胡桂明;毛世榕;;BP神经网络在说话者识别中的应用[J];装备制造技术;2011年09期
6 王瑞瑞;马建文;陈雪;;多源遥感影像自动配准技术的研究进展[J];遥感信息;2011年03期
7 刘劲;赵蕾;扶晓;;基于小波模极值的虹膜特征提取算法[J];电脑编程技巧与维护;2011年16期
8 蒋强荣;高远;张鸿宾;;基于直方图交核的人脸识别[J];北京工业大学学报;2011年08期
9 黑光月;;基于方向平面特征的脱机女书识别方法研究[J];电脑知识与技术;2011年25期
10 胡洋;吴黎慧;高磊;蒲南江;;基于SVM的语音情感识别研究[J];电子测试;2011年09期
中国重要会议论文全文数据库 前10条
1 武洪萍;周国祥;;Web文本挖掘研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
2 赵燕平;李超;;网络安全信息挖掘中的特征选择与专利分析研究[A];2004年中国管理科学学术会议论文集[C];2004年
3 林土胜;赖声礼;;视网膜血管特征提取的拆支跟踪法[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
4 钱小聪;郑宝玉;穆明鑫;;神经网络联机手写签名验证[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
5 张羽;汪源源;王威琪;余建国;林继耕;;狭窄血管多普勒信号特征提取的实验研究[A];21世纪医学工程学术研讨会论文摘要汇编[C];2001年
6 柳林霞;陈杰;窦丽华;;不变矩理论及其在目标识别中的应用[A];2002中国控制与决策学术年会论文集[C];2002年
7 杨日杰;施建礼;林洪文;;一种雷达视频回波特征提取方法研究[A];中国航空学会信号与信息处理专业全国第八届学术会议论文集[C];2004年
8 代克杰;张红梅;盛赛斌;;基于BP网络的故障特征提取方法研究[A];2004中国控制与决策学术年会论文集[C];2004年
9 何新;史迎春;周献中;;一种基于独立分量分析的音频分类方法[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
10 朱晓霞;孙同景;陈桂友;;基于支持向量机理论的两级指纹分类实现方法[A];第16届中国过程控制学术年会暨第4届全国故障诊断与安全性学术会议论文集[C];2005年
中国重要报纸全文数据库 前10条
1 燕海霞;王忆勤;李福凤;脉象信号研究日渐深入[N];中国医药报;2005年
2 沈占锋;遥感影像信息提取与分析[N];计算机世界;2006年
3 王竣;深入开发CAD系统对疾病诊断有重要意义[N];中国医药报;2007年
4 北京数码空间信息技术有限公司技术总监 刘斌;Web Mining:第二代网络信息处理技术[N];计算机世界;2000年
5 孙哲南 谭铁牛;生物识别的十大关键技术[N];计算机世界;2007年
6 上海 高博;让电脑“听懂”人话[N];电脑报;2008年
7 记者 何腾江 通讯员 周汇成;验钞新技术通过鉴定[N];中山日报;2008年
8 本报记者 刘洪宇;当机器听懂了我们的声音[N];辽宁日报;2008年
9 林木树;反垃圾邮件有待新突破[N];人民邮电;2004年
10 方忠诚;OCR技术及其应用[N];北京电子报;2000年
中国博士学位论文全文数据库 前10条
1 张旗;基于属性的图像分类研究[D];大连海事大学;2005年
2 张立福;通用光谱模式分解算法及植被指数的建立[D];武汉大学;2005年
3 苏彩红;墙地砖质量自动检测技术的研究[D];华南理工大学;2004年
4 宋余庆;医学图像数据挖掘若干技术研究[D];东南大学;2005年
5 宋晴;基于液滴分析技术和液滴指纹图的液体识别方法的研究[D];天津大学;2005年
6 吴婷;自发脑电脑机接口模式识别关键技术与实验研究[D];上海交通大学;2008年
7 孙真真;基于光学区雷达目标二维像的目标散射特征提取的理论及方法研究[D];中国人民解放军国防科学技术大学;2001年
8 武子玉;矿物近红外光谱信息提取及应用研究[D];吉林大学;2005年
9 王承;基于神经网络的模拟电路故障诊断方法研究[D];电子科技大学;2005年
10 孙蕾;医学图像智能挖掘关键技术研究[D];西北大学;2005年
中国硕士学位论文全文数据库 前10条
1 任爽;基于XML和SVM的Web文本挖掘研究[D];大连理工大学;2006年
2 曾红梅;情绪图片视觉诱发EEG特征提取与分析[D];天津大学;2012年
3 雷自力;基于Pro/E的三维零件参数化建模和特征提取研究[D];华中科技大学;2011年
4 林少波;中文文本分类特征提取方法的研究与实现[D];重庆大学;2011年
5 黄健;履带式车辆微多普勒效应与特征提取[D];国防科学技术大学;2009年
6 赵蕾蕾;基于词和基本短语模式的特征提取方法[D];河北大学;2009年
7 栾岚;基于机理模型判据的图像中微弱特征提取方法研究及应用[D];东北大学;2009年
8 王菲;面向肺部CAD的特征提取、选择及分类方法研究[D];东北大学;2009年
9 郑睿;藻类细胞图像的特征提取与分类方法研究[D];杭州电子科技大学;2009年
10 李仁杰;高分辨率SAR图像目标三维特征提取与建模[D];国防科学技术大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026