YOLO

YOLOs
CNN的位置不变性
目标
- 预测位置
通道
- 有没有1个
- 框位置4个
  - 左上角坐标，长宽
- 是什么
组成
- backbone
- 检测头
  - 7x7x30
    - 1个物品
      - 30=1+4+25
        
        25个类别
    - 2个物品
      - 30=2(1+4)+20
$L oss =$
- $λ_{coor d} i = 0 \sum S^{2} j = 0 \sum B I_{ij}^{o bj} [(x_{i} - \overset{x}{^}_{i})^{2} + (y_{i} - \overset{y}{^}_{i})^{2}]$
  - $I^{o bj}$ 是指示函数，表示有目标时
  - 预测框位置
- $+ λ_{coor d} i = 0 \sum S^{2} j = 0 \sum B I_{ij}^{o bj} [(w_{i} - \overset{w}{^}_{i})^{2} + (h_{i} - \hat{h}_{i})^{2}]$
  - 预测框位置
  - $w_{i}$ 经验公式防止长宽过大
- $+ i = 0 \sum S^{2} j = 0 \sum B I_{ij}^{o bj} (C_{i} - \hat{C}_{i})^{2} + λ_{n oo bj} i = 0 \sum S^{2} j = 0 \sum B I_{ij}^{n oo bj} (C_{i} - \hat{C}_{i})^{2}$
  - 预测有无目标
- $+ i = 0 \sum S^{2} I_{i}^{o bj} c \in c l a sses \sum (p_{i} (c) - \overset{p}{^}_{i} (c))^{2}$
  - 有目标时，预测多分类
细节
- 后处理合并
  - 结果面积排序，小的向大的合并
- 预测x,y,w,h的激活函数
  - 值域 $(0, \infty)$
    - sigmoid, tanh不行
    - relu不行，落到负区不能训练
  - 方法
    - 变成相对值
    - $b_{w} = p_{w} e^{t_{w}}$
      - $p_{w}$ 是先验宽度, $b_{w}$ 是实际宽度
        
        $p_{w}$ 怎么得到
        
        kmeans聚类得到多类标准框
        
        多类分成小、中、大三类
        
        backbone出来三种位数采样
        
        高倍采样框小，用大框 $p_{w}$ 分别预测
        
        小倍采样用大框 $p_{w}$
        
        每个框都用一次
        
        大框 $p_{w}$ 预测信息传到小框 $p_{w}$
        
        小框预测有了更大视角
        
        V3出来
      - $e^{t_{w}}$ 在 $(0, \infty)$ , $t_{w}$ 在 $(- \infty, \infty)$
      - 成了预测 $t_{w}$
        
        不用激活函数
    - x,y
      - $x = α C_{x}$
        
        $C_{x}$ 是框长度, $α$ 在[0,1]间
        
        $α = \frac{1}{1 + e ^{- t_{x}}} = σ (t_{x})$
        
        $t_{x}$ 在 $(- \infty, \infty)$
        
        成了预测 $t_{x}$
        
        V3出现
      - 问题, mse收敛慢
        
        IoU损失函数
        
        预测框、真实框
        
        交集是分子、并集是分母
        
        Loss=分数的负数
        
        问题
        
        框无重合导数为0
        
        没有意义，也不能训练
        
        改进
        
        $G I o U = I o U - \frac{A ^{c} - μ}{A ^{c}}$
        
        $A^{c}$ 是两框最大框
        
        大框套小框有问题
        
        $D I o U = I o U - \frac{ρ ^{2} ( b , b ^{g t} )}{c ^{2}} = I o U - \frac{d ^{2}}{c ^{2}} - 1 \leq D I o U \leq 1$
        
        $ρ$ 代表b和 $b^{g t}$ 的对角线距离
        
        c是b和 $b^{g t}$ 的欧式距离
迁移学习
- 不用改backbone, 训练检测头
- 数据配置
  - traffic.yaml
- 标注数据

Ukeate笔记

探索

YOLO

关系图谱

反向链接