- 无法量化的事件,无法优化
- 特征提取
- 集成学习
- 样本均衡
- 多分类问题
- 拟合问题
- 好的特征
- 和任务高度相关,有区分性
- 特征组合
- 特征变换
- 乘矩阵
- 连续特征变换
- 变换
- d1=w1x1,a1=f1(d1)d2=w2a1,a2=f2(d2)
- f1和f2大部分情况是一个函数
- 可以对特征多次变换,避免等价于1次变换的情况
- 每次变换称为一个神经元
- 加先验特征
- 问题
- 特征太多的问题
- 样本少,误导大
- 办法
- 增加数据量
- 选有普遍性的特征
- 特征有相关性
- 统计办法
- ρ=(x−x)(y−y)
- 大于0,正相关,小于0,负相关
- 等于0,无关或正交
- 消除量当
- ρ=σ(x)σ(y)E[(x−x)(y−y)]
- 特征间相关性
- 特征选择