深度学习最优化笔记,利用梯度(微分)求取最低谷点,损失函数包括数据顺势和正则化损失