收藏本站
《中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集》2006年
收藏 | 手机打开
二维码
手机客户端打开本文

基于文档中心内容快速提取的Web监控辅助系统

王灿辉  金奕江  马少平  
【摘要】:Web已成为人们获取信息的重要来源。Web数据的产生与传播变得更加自由和便捷,数据量持续爆炸式增长,因而对Web进行监控和预警的需求也更加迫切。本文提出一种快速提取文档中心内容的算法,用于缩减Web海量数据的规模。实验结果表明提取出的中心内容只占原文档大小的2.2%,在普通PC机上的处理速度达到每秒380篇,并在小规模测试集上达到了75%以上的精度。使用文档中心内容进行文档分类、聚类和热点抽取与追踪,构成了Web监控辅助系统的框架。

【相似文献】
中国重要会议论文全文数据库 前2条
1 王灿辉;金奕江;马少平;;基于文档中心内容快速提取的Web监控辅助系统[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
2 张利;孙超;刘君祖;郝胜智;黎祖刚;;基于Web的工业信息实时监控系统研究[A];2007'仪表,自动化及先进集成技术大会论文集(一)[C];2007年
中国硕士学位论文全文数据库 前4条
1 李顺亮;基于Inmarsat Fleet的船岸综合监控系统的研究[D];大连海事大学;2005年
2 杨小铸;基于嵌入式Linux的小型移动机器人远程控制系统设计[D];武汉理工大学;2007年
3 蒋海云;Web回归桌面的研究与应用[D];江南大学;2009年
4 刘君祖;基于Web的工业信息监控系统研究与实现[D];大连理工大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026