学位专题

<
DOI:10.7666/d.y691747

高可用性系统中检查点技术的研究与实现

周国峰
华中科技大学
引用
计算机系统日益深入到人类生活的各个方面,应用环境日益复杂,产生的数据也以几何级数增长,这些都导致可用性成为研究和关注的焦点.传统的容错系统对维持数据和应用的可用性已经力不从心,研究和设计一种新的高可用性系统的需求日益增长.高可用性系统主要体现在数据、软件和硬件的可用性上,设计一种基于存储网络的高可用性集群系统正是试图从数据、软件和硬件的角度来提高系统的可用性.数据、软件和硬件构成了计算机系统,这三个元素在可用性上的特征是不相同的,但是又相互依赖和互为补充,使用存储网络系统来保证数据的可用性,通过检查点和进程迁移技术来实现应用软件的高可用性,运用监测技术、热备份和集群技术来提高硬件的可用性.综合考虑,最终提出了基于存储网络的高可用性系统的方案.高可用性系统中故障的检测与诊断是实现故障恢复的关键.故障诊断应能及时准确地定位故障,占用系统开销小.故障监测服务模块采用框架设计策略,将监测的资源对象分类,针对不同的对象设计不同的监测代理,保证了系统的可扩展性.监测代理利用检查点和进程迁移技术来实现对进程的状态监测和故障恢复.检查点的实现中采用基于服务组的多进程检查点的方案,利用共享存储网络的体系结构提高了检查点文件的I/O性能和可靠性以及系统的可扩展性,而且采用了一种动态的检查点时间间隔调整机制,减小了检查点对进程的影响.

高可用性;集群;存储网络;检查点;进程迁移;服务组

华中科技大学

硕士

计算机系统结构

谢长生

2004

中文

TP302

65

2005-08-18(万方平台首次上网日期,不代表论文的发表时间)

相关文献
评论
相关作者
相关机构
打开万方数据APP,体验更流畅