• 问题
    • 客户反馈
      • 单体应用
        • 模块耦合程度
        • 微服务划分与边界
      • 单节点数据库
        • 查询崩溃
      • IoT控制
        • 命令超时失败, 响应慢
        • 出错业务处理
    • 发现问题
      • 现有代码逻辑梳理
      • 通过链路追踪,找性能瓶颈
      • SQL平台建设,发现数据库性能问题,优化SQL
      • 服务器节点监控,应用监控,数据库监控
  • 解决问题
    • 代码
      • 纯代码优化:N+1调用,事务问题
      • 逻辑优化:订单失败,复杂业务流程优化
      • 发布流程优化CI/CD
      • 中间件优化:优雅停机,灰度方案节点打标,全链路日志
      • 性能优化:业务并行处理,业务异步处理
    • 数据库
      • 不合理调用治理:批量更新,大事务,
      • 慢SQL治理
      • 数据库备份:主从优化,定时备份
      • 配置调优
    • 架构
      • 高可用:服务发现,分布式
      • 业务缓存优化,减少数据库调用:热点数据,对象缓存,多级缓存
      • 分布式任务平台:分片执行
      • 任务中心:批量平台
  • 稳定性
    • 告警平台
      • 异常告警(空指针,接口调用成功率)
      • 监控告警(服务器使用率)
      • 业务告警(下单失败)
    • 限流熔断
      • 网关限流,业务限流,接口限流,外部调用限流
      • 业务平滑处理
  • 运营工具
    • 业务数据多维分析