- YOLOs
- CNN的位置不变性
- 目标
- 通道
- 组成
- Loss=
- λcoordi=0∑S2j=0∑BIijobj[(xi−x^i)2+(yi−y^i)2]
- +λcoordi=0∑S2j=0∑BIijobj[(wi−w^i)2+(hi−h^i)2]
- +i=0∑S2j=0∑BIijobj(Ci−C^i)2+λnoobji=0∑S2j=0∑BIijnoobj(Ci−C^i)2
- +i=0∑S2Iiobjc∈classes∑(pi(c)−p^i(c))2
- 细节
- 后处理合并
- 预测x,y,w,h的激活函数
- 值域(0,∞)
- sigmoid, tanh不行
- relu不行,落到负区不能训练
- 方法
- 变成相对值
- bw=pwetw
- pw是先验宽度, bw是实际宽度
- pw怎么得到
- kmeans聚类得到多类标准框
- 多类分成小、中、大三类
- backbone出来三种位数采样
- 高倍采样框小,用大框pw分别预测
- 大框pw预测信息传到小框pw
- V3出来
- etw在(0,∞), tw在(−∞,∞)
- 成了预测tw
- x,y
- x=αCx
- Cx是框长度, α在[0,1]间
- α=1+e−tx1=σ(tx)
- V3出现
- 问题, mse收敛慢
- IoU损失函数
- 预测框、真实框
- 问题
- 框无重合导数为0
- 没有意义,也不能训练
- 改进
- GIoU=IoU−AcAc−μ
- Ac是两框最大框
- 大框套小框有问题
- DIoU=IoU−c2ρ2(b,bgt)=IoU−c2d2−1≤DIoU≤1
- ρ代表b和bgt的对角线距离
- c是b和bgt的欧式距离
- 迁移学习
- 不用改backbone, 训练检测头
- 数据配置
- 标注数据