• high-availability
  • 术语
    • 节点(node): 唯一主节点,多个备用节点
    • 资源(resource): 是节点可控制的实体,主节点发生故障时,可以被其它节点接管
      • 例如:
        • 磁盘分区
        • 文件系统
        • ip地址
        • 应用程序服务
        • nfs文件系统
    • 事件(event): 集群中可能发生的事件
      • 例如:
        • 系统故障
        • 网络连通故障
        • 网卡故障
        • 应用程序故障
    • 动作(action): 事件发生时ha的响应方式
      • 例如: 用shell 脚本对资源进行转移
  • 原则
    • 降级
    • 限流
    • 切流量
    • 可回滚
  • 办法