
梯度(gradient)到底是个什么东西?物理意义和数学意义分别是 …
我会使用尽量少的数学符号描述 梯度, 着重于意义而非计算。一个直观的例子,在机器学习领域有个术语叫「梯度下降」,你可以想象在群山之中,某个山的半山腰有只小兔子打算使用梯度 …
梯度(gradient)到底是个什么东西?物理意义和数学意义分别是 …
为了降低随机梯度的方差,从而使得迭代算法更加稳定,也为了充分利用高度优化的矩阵运算操作,在实际应用中我们会同时处理若干训练数据,该方法被称为小批量梯度下降法 (Mini- Batch …
梯度(gradient)到底是个什么东西?物理意义和数学意义分别是 …
这篇回答节选自我的专栏 《机器学习中的数学:微积分与最优化》,和大家一起谈谈方向导数和梯度。 欢迎关注我的知乎账号 @石溪 ,将持续发布机器学习数学基础及算法应用等方面的精彩 …
如何评价 Meta 新论文 Transformers without Normalization? - 知乎
Normalization这个事得好好掰扯掰扯。 上古时期,网络经常在初始几个iteration之后,loss还没下降就不动,必须得把每一层的gradient与weight的比值打印出来,针对性地调整每一层的初始 …
梯度(gradient)到底是个什么东西?物理意义和数学意义分别是 …
Dec 2, 2020 · 梯度是雅可比矩阵的一种特殊形式,当m=1时函数的雅可比矩阵就是梯度,这个概念原是为场论设定的,任何场都可以用来理解梯度,后来被引用到数学中用来指明函数在指定点 …
如何理解随机梯度下降(stochastic gradient descent,SGD)?
随机梯度下降 Stochastic Gradient Descent SGD (Vinilla基础法/Momentum动量法) 一开始SGD没有动量,叫做Vanilla SGD,也就是没有之前时刻的梯度信息。
知乎盐选 | 5.1.2 深入了解 radial-gradient ()径向渐变
5.1.2 深入了解 radial-gradient ()径向渐变 径向渐变指的是从一个中心点向四周扩散的渐变效果,光的扩散、波的扩散等都有径向渐变的特性。
如何理解 natural gradient descent? - 知乎
如何理解 natural gradient descent? natural gradient descent 就是在把gradient乘上一个fisher information matrix的逆,感觉有点像牛… 显示全部 关注者 596 被浏览
如何入门分布上的优化/Wasserstein gradient flow? - 知乎
Mar 20, 2025 · 建议读我advisor这篇入门: proceedings.mlr.press/v 这篇有很多详细的review和对比,例如欧氏空间优化的一些概念和假设推广到概率分布空间是啥?对于概率分布而言又等价 …
如何评价这篇爆火优化算法框架论文,你们看过么? - 知乎
如何评价这篇爆火优化算法框架论文,你们看过么? ResearchGate和Zenodo论文名:《Dynamic Fold Gradient Descent (DFGD): New AI Algori… 显示全部 关注者 2 被浏览