high-availability 术语 节点(node): 唯一主节点,多个备用节点 资源(resource): 是节点可控制的实体,主节点发生故障时,可以被其它节点接管 例如: 磁盘分区 文件系统 ip地址 应用程序服务 nfs文件系统 事件(event): 集群中可能发生的事件 例如: 系统故障 网络连通故障 网卡故障 应用程序故障 动作(action): 事件发生时ha的响应方式 例如: 用shell 脚本对资源进行转移 原则 降级 限流 切流量 可回滚 办法 负载均衡 限流 降级 隔离 回滚 超时与重试 压测、预案 线下、线上