收藏本站
《全国计算机安全学术交流会论文集·第二十五卷》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于UIMA AS的文本挖掘系统的性能分析与评估

蒋子海  周斌  吴泉源  
【摘要】:本文基于大规模文本数据挖掘平台UIMA AS设计了文本挖掘系统MTMS。该系统针对分布式存储的海量数据,系统内部组件采用松耦合的通讯方式,同时各部件并行处理,大大提高了系统的吞吐率。为提高MTMS数据处理速度,本文从文本挖掘和UIMA AS两个方面对MTMS的性能进行了分析,解决了目前未对采用JMS通信机制实现的分布式文本挖掘系统进行性能分析的问题。实验表明,通过对相应瓶颈问题进行解决,在MTMS并行粒度N18时,随着N的增加,该系统处理速度呈线性增长。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 余传明;黄建秋;郭飞;;从客户评论中识别命名实体——基于最大熵模型的实现[J];现代图书情报技术;2011年05期
2 张海粟;马大明;邓智龙;;基于维基百科的语义知识库及其构建方法研究[J];计算机应用研究;2011年08期
3 史伟;王洪伟;;在线产品评论检索系统研究[J];情报杂志;2011年09期
4 杜芳芳;;数据挖掘技术在远程教学辅助系统中的应用研究[J];河南科技;2011年12期
5 吴梦兰;;WEB内容推荐算法在远程教育中的应用[J];电脑知识与技术;2011年26期
6 王玫;张兰华;张月东;;电子病历中可视化数据挖掘技术的应用[J];微计算机信息;2011年07期
7 李向东;刘晓斌;武利平;常洪梅;;面向路线图编制的模糊均值文本聚类挖掘方法研究[J];河北工业大学学报;2011年03期
8 黄瑾娉;苏庭波;;一种产品评论信息的意见挖掘技术研究[J];工业控制计算机;2011年06期
9 陈阳;凌俊民;蒙圣光;;投诉数据智能挖掘分类管理系统[J];数字技术与应用;2011年06期
10 陈叶旺;余金山;;一种改进的朴素贝叶斯文本分类方法[J];华侨大学学报(自然科学版);2011年04期
11 夏火松;刘建;朱慧毅;;中文情感分类挖掘预处理关键技术比较研究[J];情报杂志;2011年09期
12 ;第七届全国信息检索学术会议(CCIR 2011)征文通知[J];模式识别与人工智能;2011年03期
13 陶惠;张妍;郝光权;;基于向量空间的文档聚类算法分析[J];电脑知识与技术;2011年20期
14 王斌;朴顺姬;邵华清;;基于粗糙集的KNN的WEB文本分类的研究[J];数字技术与应用;2011年08期
15 孙桂煌;;一种基于n-gram短语的文本聚类方法研究[J];现代计算机(专业版);2011年14期
16 杨振宇;;中英文混合字符串切分技术[J];电脑知识与技术;2011年14期
17 张伟;欧吉顺;周楚新;;利用数据挖掘技术建设农业智能综合信息服务平台[J];农业网络信息;2011年08期
18 张素莉;潘欣;;一种新颖的基于马氏距离的文本分类方法的研究[J];长春工程学院学报(自然科学版);2011年02期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 蒋子海;周斌;吴泉源;;基于UIMA AS的文本挖掘系统的性能分析与评估[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
2 王继成;孙颖;张福炎;;文本挖掘-数据挖掘研究的新课题[A];第十六届全国数据库学术会议论文集[C];1999年
3 陈林;王晓华;李殿赟;文俊浩;;基于自增模式的文本挖掘研究[A];’2004计算机应用技术交流会议论文集[C];2004年
4 樊延平;马亚龙;袁野;;军事想定数据挖掘技术研究[A];中国系统仿真学会第五次全国会员代表大会暨2006年全国学术年会论文集[C];2006年
5 李彦鹏;杨志豪;林鸿飞;;基于条件随机域的生物医学命名实体识别[A];第三届学生计算语言学研讨会论文集[C];2006年
6 ;TRS搜索引擎和文本挖掘系统[A];中国中文信息学会第六次全国会员代表大会暨成立二十五周年学术会议中文信息处理重大成果汇报展资料汇编[C];2006年
7 王波;王厚峰;;基于自学习策略的产品特征自动识别(英文)[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
8 杨志豪;林鸿飞;;生物医学文献中的隐含知识发现[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
9 苏变萍;侯筱婷;;文本数据的非线性降维方法研究[A];2007年全国开放式分布与并行计算机学术会议论文集(下册)[C];2007年
10 袁特;顾新建;胡恒杰;许琦;;一种企业竞争情报系统的研究[A];先进制造技术论坛暨第五届制造业自动化与信息化技术交流会论文集[C];2006年
中国重要报纸全文数据库 前5条
1 ;用挖掘技术使学术资源利用效益最大化[N];中国计算机报;2007年
2 张德政;信息挖掘商业智能之“芯”[N];中国计算机报;2002年
3 刘洁;SAS分析产品链增添“新成员”[N];科技日报;2008年
4 ;未来十年展望之体验技术[N];中国计算机报;2010年
5 ;自助服务BI、实时分析声势渐强[N];网络世界;2011年
中国博士学位论文全文数据库 前10条
1 李芳;文本挖掘若干关键技术研究[D];北京化工大学;2010年
2 陈伟;基于时序文本挖掘的新闻内容理解与推荐技术研究[D];浙江大学;2010年
3 张翔;文本挖掘技术研究及其在综合风险信息网络中的应用[D];西北大学;2011年
4 周雪忠;文本挖掘在中医药中的若干应用研究[D];浙江大学;2004年
5 刘永丹;文档数据库若干关键技术研究[D];复旦大学;2004年
6 陈晓云;文本挖掘若干关键技术研究[D];复旦大学;2005年
7 王明春;基于粗糙集的数据及文本挖掘方法研究[D];天津大学;2005年
8 孙道军;文本挖掘预处理相关基础技术分析与应用研究[D];北京邮电大学;2008年
9 杨志豪;面向生物医学领域的文本挖掘技术研究[D];大连理工大学;2008年
10 高茂庭;文本聚类分析若干问题研究[D];天津大学;2007年
中国硕士学位论文全文数据库 前10条
1 徐爱华;面向文本分类的中文文本挖掘技术研究及实现[D];武汉理工大学;2004年
2 刘明岩;面向语义关系发现的文本挖掘研究[D];南京理工大学;2010年
3 薛浩;基于SOM聚类的WEB文本挖掘及其结果的可视化研究[D];南京航空航天大学;2010年
4 李钝;基于粗糙集理论的文本挖掘技术研究[D];山西大学;2003年
5 程春惠;公安犯罪案件文本挖掘关键技术研究[D];浙江大学;2010年
6 姚继伟;基于XML的Web文本挖掘的研究[D];吉林大学;2010年
7 陶小波;电子就业文本挖掘系统关键技术研究与应用[D];浙江工商大学;2011年
8 杨斌;中文文本数据挖掘研究[D];湘潭大学;2002年
9 唐明;文本挖掘及其在多文化交流平台中的应用[D];西南大学;2006年
10 李明;数据清洗技术在文本挖掘中的应用[D];南京理工大学;2008年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978