收藏本站
《全国计算机安全学术交流会论文集·第二十五卷》2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于UIMA AS的文本挖掘系统的性能分析与评估

蒋子海  周斌  吴泉源  
【摘要】:本文基于大规模文本数据挖掘平台UIMA AS设计了文本挖掘系统MTMS。该系统针对分布式存储的海量数据,系统内部组件采用松耦合的通讯方式,同时各部件并行处理,大大提高了系统的吞吐率。为提高MTMS数据处理速度,本文从文本挖掘和UIMA AS两个方面对MTMS的性能进行了分析,解决了目前未对采用JMS通信机制实现的分布式文本挖掘系统进行性能分析的问题。实验表明,通过对相应瓶颈问题进行解决,在MTMS并行粒度N18时,随着N的增加,该系统处理速度呈线性增长。

【参考文献】
中国期刊全文数据库 前2条
1 王继成,潘金贵,张福炎;Web文本挖掘技术研究[J];计算机研究与发展;2000年05期
2 韩客松,王永成;文本挖掘、数据挖掘和知识管理——二十一世纪的智能信息处理[J];情报学报;2001年01期
【共引文献】
中国期刊全文数据库 前10条
1 钱立三;WEB日志挖掘在远程开放教育中的应用[J];安徽广播电视大学学报;2005年03期
2 钟晓旭;胡学钢;;基于数据挖掘的Web招聘信息相关性分析[J];安徽建筑工业学院学报(自然科学版);2010年04期
3 陈霞;;如何加强企业文化建设[J];北方经济;2006年20期
4 武旭,须德;基于向量空间模型的文本自动分类系统的研究与实现[J];北方交通大学学报;2003年02期
5 胡健;杨炳儒;宋泽锋;钱榕;;基于非结构化数据挖掘结构模型的Web文本聚类算法[J];北京科技大学学报;2008年02期
6 暴海龙,李金林;专利检索中的IPC和主题词识别方法研究[J];北京理工大学学报(社会科学版);2003年05期
7 谢秋华;;Web文本挖掘的相关技术问题探讨[J];长春理工大学学报;2010年07期
8 贾丙静;吴长勤;葛华;;Web文本聚类的研究与实现[J];长春师范学院学报;2011年06期
9 黄显堂;基于网络的信息资源开发与服务[J];长春大学学报;2003年03期
10 王志明;沙莎;;Web文本挖掘技术在新闻主题检测中的应用研究[J];长沙大学学报;2007年05期
中国重要会议论文全文数据库 前4条
1 代广珍;徐超;;基于Web的数据挖掘研究综述[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 雷育生;甘仞初;杨军;;一种基于用户偏好的虚拟网站信息结构自适应调整算法[A];2007年全国第十一届企业信息化与工业工程学术会议论文集[C];2007年
3 王丹;蔡红柳;王斌;;基于混沌序列的数字水印算法[A];第一届中国高校通信类院系学术研讨会论文集[C];2007年
4 付延强;韩慧健;;HHME:基于形式概念分析的中文FAQ问答系统[A];第八届和谐人机环境联合学术会议(HHME2012)论文集NCMT[C];2012年
中国博士学位论文全文数据库 前10条
1 牟向伟;模糊语义个性化推荐系统在电子政务中的应用研究[D];大连海事大学;2010年
2 熊回香;面向Web3.0的大众分类研究[D];华中师范大学;2011年
3 杨瑞龙;基于短语特征的Web文档聚类方法研究[D];重庆大学;2010年
4 代劲;云模型在文本挖掘应用中的关键问题研究[D];重庆大学;2011年
5 方兆宝;基于空间数据挖掘的MCSs时空演变规律研究[D];中国矿业大学(北京);2004年
6 简(王争)峰;基于XML的异构产品信息网上交换、检索技术研究与应用[D];浙江大学;2002年
7 陈定权;自动主题搜索的应用研究[D];中国科学院研究生院(文献情报中心);2003年
8 李四明;基于智能Agent的网上农业信息挖掘研究[D];中国农业大学;2003年
9 俞方桦;互联网信息资源整合研究[D];东华大学;2001年
10 常明山;面向大规模定制产品规划关键技术的研究[D];天津大学;2003年
中国硕士学位论文全文数据库 前10条
1 吕晨;搜索竞价广告关键词优化问题研究[D];山东科技大学;2010年
2 范丹;Web检索中的查询扩展及结果聚类技术研究[D];辽宁师范大学;2010年
3 孙原;基于酉变换的权威页面挖掘算法研究[D];哈尔滨工程大学;2010年
4 程淑玉;基于协同过滤算法的个性化推荐系统的研究[D];合肥工业大学;2010年
5 钟晓旭;基于Web招聘信息的文本挖掘系统研究[D];合肥工业大学;2010年
6 周绪倩;基于电子商务的Web数据挖掘系统架构研究[D];河北工程大学;2010年
7 艾伟;基于本体的Web信息文本挖掘与检索服务研究[D];北京信息控制研究所;2010年
8 姜晓伟;粒子群算法在查询优化中的应用[D];哈尔滨理工大学;2010年
9 陈冰泉;面向农产品信息的主题搜索引擎与信息推荐[D];华南理工大学;2010年
10 周志辉;基于用户兴趣模型的个性化搜索引擎研究与分析[D];江西理工大学;2010年
【二级参考文献】
中国期刊全文数据库 前1条
1 邹涛,王继成,张福炎;基于WWW的资料搜集系统的设计与实现[J];情报学报;1999年03期
【相似文献】
中国期刊全文数据库 前10条
1 孙玉娣;裴勇;;基于可视化文本挖掘的本体构建[J];情报杂志;2007年12期
2 ;浅析大规模文本数据挖掘技术在媒体中的创新应用[J];中国传媒科技;2007年11期
3 渡部勇;;文本挖掘技术应用于专利检索分析[J];微电脑世界;2007年12期
4 苏芳仲,林世平;Web文本挖掘中的一种中文分词算法研究及其实现[J];福州大学学报(自然科学版);2004年S1期
5 付国瑜;;Web文本分类挖掘[J];科学咨询(决策管理);2008年03期
6 曹丽君;刘西印;杨燕萍;;WEB页面文本挖掘的价值与未来探究[J];商场现代化;2008年09期
7 韩洁;;Web文本挖掘技术在信息生产领域的应用研究[J];硅谷;2010年08期
8 胥桂仙,杨丹丹,高旭,陈立新;中文文本挖掘中姓名特征提取技术的研究[J];中央民族大学学报(自然科学版);2003年04期
9 刘春艳,张爱连,胡铁军;数据挖掘及其在信息服务业应用的研究现状[J];医学情报工作;2004年06期
10 吕冬煜,党齐民;基于文本挖掘的可视化竞争情报提取[J];计算机应用与软件;2005年02期
中国重要会议论文全文数据库 前10条
1 蒋子海;周斌;吴泉源;;基于UIMA AS的文本挖掘系统的性能分析与评估[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
2 王继成;孙颖;张福炎;;文本挖掘-数据挖掘研究的新课题[A];第十六届全国数据库学术会议论文集[C];1999年
3 陈林;王晓华;李殿赟;文俊浩;;基于自增模式的文本挖掘研究[A];’2004计算机应用技术交流会议论文集[C];2004年
4 樊延平;马亚龙;袁野;;军事想定数据挖掘技术研究[A];中国系统仿真学会第五次全国会员代表大会暨2006年全国学术年会论文集[C];2006年
5 李彦鹏;杨志豪;林鸿飞;;基于条件随机域的生物医学命名实体识别[A];第三届学生计算语言学研讨会论文集[C];2006年
6 ;TRS搜索引擎和文本挖掘系统[A];中国中文信息学会第六次全国会员代表大会暨成立二十五周年学术会议中文信息处理重大成果汇报展资料汇编[C];2006年
7 王波;王厚峰;;基于自学习策略的产品特征自动识别(英文)[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
8 杨志豪;林鸿飞;;生物医学文献中的隐含知识发现[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
9 苏变萍;侯筱婷;;文本数据的非线性降维方法研究[A];2007年全国开放式分布与并行计算机学术会议论文集(下册)[C];2007年
10 袁特;顾新建;胡恒杰;许琦;;一种企业竞争情报系统的研究[A];先进制造技术论坛暨第五届制造业自动化与信息化技术交流会论文集[C];2006年
中国重要报纸全文数据库 前5条
1 ;用挖掘技术使学术资源利用效益最大化[N];中国计算机报;2007年
2 张德政;信息挖掘商业智能之“芯”[N];中国计算机报;2002年
3 刘洁;SAS分析产品链增添“新成员”[N];科技日报;2008年
4 ;未来十年展望之体验技术[N];中国计算机报;2010年
5 ;自助服务BI、实时分析声势渐强[N];网络世界;2011年
中国博士学位论文全文数据库 前10条
1 李芳;文本挖掘若干关键技术研究[D];北京化工大学;2010年
2 陈伟;基于时序文本挖掘的新闻内容理解与推荐技术研究[D];浙江大学;2010年
3 文翰;面向信息检索的Web文本挖掘方法研究[D];华南理工大学;2012年
4 张翔;文本挖掘技术研究及其在综合风险信息网络中的应用[D];西北大学;2011年
5 周雪忠;文本挖掘在中医药中的若干应用研究[D];浙江大学;2004年
6 刘永丹;文档数据库若干关键技术研究[D];复旦大学;2004年
7 陈晓云;文本挖掘若干关键技术研究[D];复旦大学;2005年
8 王明春;基于粗糙集的数据及文本挖掘方法研究[D];天津大学;2005年
9 孙道军;文本挖掘预处理相关基础技术分析与应用研究[D];北京邮电大学;2008年
10 杨志豪;面向生物医学领域的文本挖掘技术研究[D];大连理工大学;2008年
中国硕士学位论文全文数据库 前10条
1 徐爱华;面向文本分类的中文文本挖掘技术研究及实现[D];武汉理工大学;2004年
2 刘明岩;面向语义关系发现的文本挖掘研究[D];南京理工大学;2010年
3 李钝;基于粗糙集理论的文本挖掘技术研究[D];山西大学;2003年
4 程春惠;公安犯罪案件文本挖掘关键技术研究[D];浙江大学;2010年
5 姚继伟;基于XML的Web文本挖掘的研究[D];吉林大学;2010年
6 陶小波;电子就业文本挖掘系统关键技术研究与应用[D];浙江工商大学;2011年
7 杨斌;中文文本数据挖掘研究[D];湘潭大学;2002年
8 唐明;文本挖掘及其在多文化交流平台中的应用[D];西南大学;2006年
9 李明;数据清洗技术在文本挖掘中的应用[D];南京理工大学;2008年
10 靳晓恩;数字图书馆的知识发现研究[D];湘潭大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026