- Support Vector Machine, 支持向量机
- 评价
- 好处
- 缺点
- 没有概率意义,只有几何意义
- 点是耦合的
- 要遍历所有样本,找到边界点
- 数据量大时,资源要求高
- 不能分布式
- 公式
- w=i∈SN∑nαiyixi
- 算出向量
- SN是边界点集合
- αi表示第i条数据的权重(边界权重)
- 数学解法拉格朗日求极值
- 找边界点
- w0=yi−wxi
- wx=i∈SN∑nαiyixix
- xix是内积,表示相似度
- 向量被相似度高的边界点影响大
- 相当于边界点的KNN
- 找到w
- 泛化能力
- ∥w∥2∥wx+w0∥
- ∥wx1+w0∥缩放成1
- 求max ∥w∥2, 既 min ∥w∥
- 正确分类
- y=1表示分类正确,y=0表示分类错误
- yi(wxi+w0)>0
- 相当于换了损失函数的L2正则
- 线性不可分时
- min ∥w∥+ci=1∑nϵi
- 网格搜索,找到合适的超参数
- ϵi=max(0,1−yi(wx+w0))
- 对x升维
- 因为w可分解成样本数据点表示
- wx=i∈SN∑nαiyi⟨ϕ(x),ϕ(xi)⟩
- 核方法
- k(⟨xi,xj⟩)=⟨ϕ(xi),ϕ(xj)⟩
- 高斯核函数
- 线性核函数
- 多项式核函数
- yi(wxi+w0)>1−ϵi