基于UIMA AS的文本挖掘系统的性能分析与评估
【摘要】:本文基于大规模文本数据挖掘平台UIMA AS设计了文本挖掘系统MTMS。该系统针对分布式存储的海量数据,系统内部组件采用松耦合的通讯方式,同时各部件并行处理,大大提高了系统的吞吐率。为提高MTMS数据处理速度,本文从文本挖掘和UIMA AS两个方面对MTMS的性能进行了分析,解决了目前未对采用JMS通信机制实现的分布式文本挖掘系统进行性能分析的问题。实验表明,通过对相应瓶颈问题进行解决,在MTMS并行粒度N18时,随着N的增加,该系统处理速度呈线性增长。
【相似文献】 | ||
|
|||||||||||||||||||||||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||
|