一种新的集群监视系统(IF-Monitor)的设计和实现
【摘要】:集群计算系统是高性能计算的一种性价比相当高的解决方案,但目前许多自己建立的集群计算系统一般只提供资源管理及作业调度能力,缺乏集群系统的监视功能。集群系统就像是一个“黑盒子”,很难了解它们的运行状况,以及什么地方出现系统的瓶颈。中国科学院高能所的物理分析等计算环境均是基于集群系统的,随着计算环境的不断扩充和校园网格的实施,集群运行效率更加难以预测。为此,设计了IF-Monitor(IHEP FARM MONITOR)集群监视解决方案,实现了实时监视若干集群整体运行情况及监视和记录各个节点的系统功能。
【相似文献】 | ||
|
|||||||||||||||||||||||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||
|
|
|||||||||||||||||||||
|
|
|||
|