Residual Network, 微软,何凯明 残差网络shortcut 差异学习 做法 新层输入加原始x 解决CV的深度更深会梯度消失的问题 CV中的好处,卷积+池化 避免提取特征丧失细节 一般18层