• Deep Neural Network,深度神经网络
  • 特征工程
  • 激活函数
  • 梯度下降法
  • 反向传播
  • 分类
    • 惯序模型
    • 函数性模型
      • 多输入·输出
  • 历史
    • 原来的BP模型
      • 2012年后发展成深度学习
  • 学习过程
        • c为D的向量长度
            • 是对角矩阵
              • 趋向0
            • 是w
  • 权重初始化
    • 随机
      • 随机系数
        • 均匀分布
          • ReLU中
            • 能更好利用非线性
            • 方差与总数反相关
            • w与神经元个数反相关,因为:
                • 要控制幅度,N越大,w越小
  • 优化
    • 局部极小问题
      • 越高次项,局部极小越多
    • 悬崖下降
      • Loss可能增大
    • 平缓
      • 不好收敛,训练时间长
    • 鞍点
      • 但有下降空间
        • 所有方向都<0
  • Loss分类
    • 和目标的Loss
    • 各层的Loss