Resudual Net

另一种解决梯度消失的方法

Untitled

因为加入了x,在计算梯度时x的导数为1,很多层相乘之后不会出现趋近于0的情况