• YOLOs
  • CNN的位置不变性
  • 目标
    • 预测位置
  • 通道
    • 有没有1个
    • 框位置4个
      • 左上角坐标,长宽
    • 是什么
  • 组成
    • backbone
    • 检测头
      • 7x7x30
        • 1个物品
          • 30=1+4+25
            • 25个类别
        • 2个物品
          • 30=2(1+4)+20
      • 是指示函数,表示有目标时
      • 预测框位置
      • 预测框位置
      • 经验公式防止长宽过大
      • 预测有无目标
      • 有目标时,预测多分类
  • 细节
    • 后处理合并
      • 结果面积排序,小的向大的合并
    • 预测x,y,w,h的激活函数
      • 值域
        • sigmoid, tanh不行
        • relu不行,落到负区不能训练
      • 方法
        • 变成相对值
          • 是先验宽度, 是实际宽度
            • 怎么得到
              • kmeans聚类得到多类标准框
                • 多类分成小、中、大三类
                • backbone出来三种位数采样
                  • 高倍采样框小,用大框分别预测
                    • 小倍采样用大框
                    • 每个框都用一次
                  • 大框预测信息传到小框
                    • 小框预测有了更大视角
                • V3出来
          • ,
          • 成了预测
            • 不用激活函数
        • x,y
            • 是框长度, 在[0,1]间
              • 成了预测
            • V3出现
          • 问题, mse收敛慢
            • IoU损失函数
              • 预测框、真实框
                • 交集是分子、并集是分母
                  • Loss=分数的负数
              • 问题
                • 框无重合导数为0
                  • 没有意义,也不能训练
                  • 改进
                      • 是两框最大框
                      • 大框套小框有问题
                          • 代表b和的对角线距离
                          • c是b和的欧式距离
  • 迁移学习
    • 不用改backbone, 训练检测头
    • 数据配置
      • traffic.yaml
    • 标注数据