使用简单的循环神经网络理解RNN中的梯度消失问题,并比较relu和sigmoid的不同