• APM(Application Performance Monitoring)工具
    • OpenTelemetry
    • SkyWalking
    • CAT
    • Jaeger
    • Pinpoint
    • Zipkin
    • Dapper
      • C#
  • 组件
  • 基础
    • 监控的方式
      • 主动、被动、旁路(舆情)
    • 监控类型
      • 服务端监控、客户端监控
    • 目标
      • 全、块、准
    • 指标
      • 请求量、成功率、耗时
  • 监控报警
    • 机器负载、响应时间、可用率
    • tracing
  • 业务监控
    • 包括
      • 基础数据
        • QPS
        • DAU日活
        • 访问状态码
        • 业务接口具体接口
      • 自定义数据
        • 埋点数据
        • 产品转化率
        • 充值额度
        • 客诉
      • 指标
        • 访问、访客
        • 停留时长
        • 跳出率
        • 退出率
        • 转化率
        • 参与度
    • 埋点
      • 通过可视化工具配置,非硬编码
    • 发展
      • 设置静态阈值无法满足
        • 不同业务、不同时间段要求不同阈值
        • 业务周期性趋势,规则配置易误报
        • 特殊业务场景,如活动,引起冲高回落,引起误报
        • 大量维度业务,如千万级用户、上百错误码,不好配置
      • 自动化报警,根据业务特征和历史数据,生成动态阈值
      • 产品
  • 分布式监控
    • Metrics(api统计, cpu、内存、时长、平均、缓存命中等)
    • 调用链跟踪(Trace)
    • 日志
    • 健康检查和告警
    • 服务网可视化
  • 系统级别监控
    • 物理监控
      • 存活、内存、CPU、load、硬盘(速率、使用率)、网络
    • 活性检测
      • 进程、端口
    • 应用服务监控
      • JVM、GC、线程数
    • 服务监控
      • RPC和HTTP接口
        • QPS、RT、错误码
  • 网络监控
    • IDC
    • 网络状态监控
      • 交换机、路由器、防火墙、VPN
      • 内网(物理内网、逻辑内网)
      • 外网
        • 丢包率、网络重传、延迟
  • 日志监控
    • 系统日志、设备日志、用户行为日志
    • 后续加工
    • 数据监控指标
    • 链路监控
    • 中间件监控
    • 异常监控
  • 程序代码监控
  • 用户行为分析监控
  • MySQL、Oracle、PostgreSQL