XGBoost

目标函数
- $O b j^{(t)} = i = 1 \sum n l (y_{i}, \overset{y}{^}_{i}^{t}) + i = 1 \sum t Ω (f_{i}) = i = 1 \sum n l (y_{i}, \overset{y}{^}_{i}^{t - 1} + f_{t} (x_{i})) + i = 1 \sum t Ω (f_{i})$
  - 泰勒展开 $= i = 1 \sum n [l (y_{i}, \overset{y}{^}_{i}^{t - 1}) + g_{i} f_{t} (x_{i}) + \frac{1}{2} h_{i} f_{t}^{2} (x_{i})] + i = 1 \sum t Ω (f_{i})$
    - $\overset{y}{^}_{i}^{t - 1}$ 视为x, $f_{t} (x_{i})$ 视为 $Δ x$
    - 代入mse损失函数
      - $g_{i} = \frac{\partial ( y ^ ^{t - 1} - y _{i} ) ^{2}}{\partial y ^ ^{t - 1}} = 2 (\overset{y}{^}^{t - 1} - y_{i})$
      - $h_{i} = \frac{\partial ^{2} ( y ^ ^{t - 1} - y _{i} ) ^{2}}{y ^ ^{t - 1}} = 2$
    - 优化目标
      - 舍去 $l (y_{i}, \overset{y}{^}_{i}^{t - 1})$
      - $i = 1 \sum t Ω (f_{i})$ 是正则项
        
        $Ω (f_{i}) = γ T + \frac{1}{2} λ j = 1 \sum T w_{j}^{2}$
        
        根据经验定义的
        
        T是叶子节点个数, $γ$ 控制复杂度
        
        $λ$ 控制叶子和的影响力
      - $= i = 1 \sum n [g_{i} w_{q (x_{i})} + \frac{1}{2} h_{i} w_{q (x_{i})}^{2}] + γ T + \frac{1}{2} λ j = 1 \sum T w_{j}^{2}$
        
        $= j = 1 \sum T [(i \in I_{j} \sum g_{i}) w_{j} + \frac{1}{2} (i \in I_{j} \sum h_{i} + λ) w_{j}^{2}] + γ T$
        
        叶子节点角度
        
        $= j = 1 \sum T [G_{j} w_{j} + \frac{1}{2} (H_{j} + λ) w_{j}^{2}] + γ T$
        
        $G_{j}$ 是一阶导数常数值, $H_{j}$ 是二阶导数常数值
        
        $\frac{\partial L _{1}}{\partial w _{j}} = G_{j} + (H_{j} + λ) w_{j} = 0$
        
        $w_{j} = - \frac{G _{j}}{H _{j} + λ}$ 时Obj为极值
        
        $λ > 0, H_{j} \geq 0$ , 所以是极小值
        
        代入得 $O bj = - \frac{1}{2} j = 1 \sum T \frac{G _{j}^{2}}{H _{j} + λ} + γ T$
        
        一个节点分裂
        
        分裂前 $O b j_{1} = - \frac{1}{2} [\frac{( G _{L} + G _{R} ) ^{2}}{H _{L} + H _{R} + λ}] + γ$
        
        分裂后 $O b j_{2} = - \frac{1}{2} [\frac{G _{L}^{2}}{H _{L} + λ} + \frac{G _{R}^{2}}{H _{R} + λ}] + 2 γ$
        
        $G ain = O b j_{1} - O b j_{2}$
        
        遍历所有条件，找到Gain最大一个的作为分裂条件
相比GBDT
- 用了二阶泰勒展开
  - 多考虑了变化方向的方向，学习速度快
实现
- 定义损失函数+正则项
- 求解各点g和h，已由前面分类器决定
- 根节点开始，计算各节点分裂条件
  - 深度是超参数限制

Ukeate笔记

探索

XGBoost

关系图谱

反向链接