• KL距离
  • FM模型
  • 分类函数
    • 为什么
      • 概率密度
        • 判别模型,可以用来做分类
  • 实现
    • 随机一个w
    • 计算模型输出和真实数值差异,得到损失函数(mse, kl距离)
    • 不停调整w让损失函数变小
  • 计算
    • 对w求导
          • 两边总有一个为0
    • 为什么不用mse
        • w非常大时,fi趋向1或0
          • 很小,很小,训练效果不好,走向局部最小值
          • 体现出取w正常值时,也会很小
        • 是否通过选初始点解决
          • 局部极小的数量和维数平方成正比