10.3969/j.issn.1004-7530.2015.21.014
集群系统分布式任务故障冗余管理机制的设计与实现
目前集群系统因节点数量和计算任务规模不断增长,导致任务故障概率不断增加,设计和实现集群系统分布式任务故障冗余机制就是为了解决集群系统的上述问题。文章首先介绍了集群系统分布式任务故障冗余管理的体系架构;然后详细阐述了任务故障检测及恢复、集群单点故障问题的解决、任务状态同步等关键技术;最后,通过实验室环境测试进一步表明,该机制能够增强集群系统运行的可靠性,保障集群系统分布式任务的稳定运行。
集群系统、分布式任务、高可用、故障冗余
TP3;TN9
2015-09-14(万方平台首次上网日期,不代表论文的发表时间)
共3页
37-39