问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

为什么随机梯度下降方法能够收敛?

发布网友 发布时间:2022-04-25 16:21

我来回答

2个回答

热心网友 时间:2022-05-04 19:54

其实这个还是要好好的看看论文,然后让导师再给你好好的讲解一下吧,我这里只能说我自己的理解。

随机梯度下降算法

首先要知道什么是随机并行梯度下降算法。其实等于没有模型的优化的算法,就是更加的适用于那种控制变量比较多的,但是系统比较复杂的,又没有办法准确的去建立数学模型的优化控制的过程。


期望收敛

其实我个人觉得是期望收敛而已吧,因为我们在进行梯度估计的时候,基本上是提高梯度的估计精确度,然后实施以下正向扰动和负向扰动的,基本上两次扰动后,所有的函数值都会指示出梯度的估计。


模型训练

其实我们知道在遇到一些比较复杂的都会选择建模,那么在模型训练的时候。基本上我们是把代价函数作为非凸的,那么获得的都是局部最优。这样就不确定是不是可以收敛到全局最优的效果了。

在局部最优的时候,参数的表现是基本稳定下来,不再发生任何变化。既然使用的数据少(随机梯度下降法就用的数据少)可能无法找到局部最优值,因为在很大概率上,它确实是能够靠近的,又不用那么大的计算量,所以就被广泛使用了。

所以说我觉得其实都是期望收敛而已。


总结

其实我觉得我说这么多,不一定说明白啥,基本上我个人是觉得对于这种随机梯度下降的方法是期望收敛而已,真的是没有办法确定是否收敛的。

毕竟我没有论文专业,更没有导师专业,我只是用我自己的知识能力去回答的问题,所以说我由衷的建议你去看论文,看不懂就去问导师了,那才是正道啊,像我们这种人,毕竟没有那么专业,我害怕让你误入歧途。

热心网友 时间:2022-05-04 21:12

梯度下降法是一个一阶最优化算法,通常也称为最速下降法。要使用梯度下降法找到一个函数的局部极小值,必须向函数上当前点对应梯度(或者是近似梯度)的反方向的规定步长距离点进行迭代搜索。

是用当前位置负梯度方向作为搜索方向,因为该方向为当前位置的最快下降方向,所以也被称为是最速下降法,最速下降法越接近目标值,步长越小(cost函数是凸函数,比如x^2梯度就是越来越小),前进越慢。

靠近极小值时速度减慢。

直线搜索可能会产生一些问题。

可能会“之字型”地下降。

梯度下降中,x =φ(x) = x - f'(x),φ'(x) = 1 - f''(x) != 0极值领域一般应该不会满足为0。则根据高阶收敛定理2.6可以梯度下降在根*x附近一般一阶收敛。

梯度下降方法中,负梯度方向从局来看是二次函数的最快下降方向,但是从整体来看却并非最好。

梯度下降法实现简单,当目标函数是凸函数时,梯度下降法的解是全局解。一般情况下,其解不保证是全局最优解,梯度下降法的速度也未必是最快的。

Mini-batch gradient它还是采用了batch的思路,也就是所有样本一起更新。和batch不同的是mini,在求解方向的时候选择了一部分样本一起更新,这样就减少了计算量,同时它又不像SGD那样极端只使用一个样本,所以保证了方向的精确性。

热心网友 时间:2022-05-04 19:54

其实这个还是要好好的看看论文,然后让导师再给你好好的讲解一下吧,我这里只能说我自己的理解。

随机梯度下降算法

首先要知道什么是随机并行梯度下降算法。其实等于没有模型的优化的算法,就是更加的适用于那种控制变量比较多的,但是系统比较复杂的,又没有办法准确的去建立数学模型的优化控制的过程。


期望收敛

其实我个人觉得是期望收敛而已吧,因为我们在进行梯度估计的时候,基本上是提高梯度的估计精确度,然后实施以下正向扰动和负向扰动的,基本上两次扰动后,所有的函数值都会指示出梯度的估计。


模型训练

其实我们知道在遇到一些比较复杂的都会选择建模,那么在模型训练的时候。基本上我们是把代价函数作为非凸的,那么获得的都是局部最优。这样就不确定是不是可以收敛到全局最优的效果了。

在局部最优的时候,参数的表现是基本稳定下来,不再发生任何变化。既然使用的数据少(随机梯度下降法就用的数据少)可能无法找到局部最优值,因为在很大概率上,它确实是能够靠近的,又不用那么大的计算量,所以就被广泛使用了。

所以说我觉得其实都是期望收敛而已。


总结

其实我觉得我说这么多,不一定说明白啥,基本上我个人是觉得对于这种随机梯度下降的方法是期望收敛而已,真的是没有办法确定是否收敛的。

毕竟我没有论文专业,更没有导师专业,我只是用我自己的知识能力去回答的问题,所以说我由衷的建议你去看论文,看不懂就去问导师了,那才是正道啊,像我们这种人,毕竟没有那么专业,我害怕让你误入歧途。

热心网友 时间:2022-05-04 21:12

梯度下降法是一个一阶最优化算法,通常也称为最速下降法。要使用梯度下降法找到一个函数的局部极小值,必须向函数上当前点对应梯度(或者是近似梯度)的反方向的规定步长距离点进行迭代搜索。

是用当前位置负梯度方向作为搜索方向,因为该方向为当前位置的最快下降方向,所以也被称为是最速下降法,最速下降法越接近目标值,步长越小(cost函数是凸函数,比如x^2梯度就是越来越小),前进越慢。

靠近极小值时速度减慢。

直线搜索可能会产生一些问题。

可能会“之字型”地下降。

梯度下降中,x =φ(x) = x - f'(x),φ'(x) = 1 - f''(x) != 0极值领域一般应该不会满足为0。则根据高阶收敛定理2.6可以梯度下降在根*x附近一般一阶收敛。

梯度下降方法中,负梯度方向从局来看是二次函数的最快下降方向,但是从整体来看却并非最好。

梯度下降法实现简单,当目标函数是凸函数时,梯度下降法的解是全局解。一般情况下,其解不保证是全局最优解,梯度下降法的速度也未必是最快的。

Mini-batch gradient它还是采用了batch的思路,也就是所有样本一起更新。和batch不同的是mini,在求解方向的时候选择了一部分样本一起更新,这样就减少了计算量,同时它又不像SGD那样极端只使用一个样本,所以保证了方向的精确性。
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
荣耀v20杀后台严重? 聊天时哪些回复让人感觉不舒服? 货物运输保险案例分析 卞和泣玉注释 求解,卞和泣玉没学过,在线等解。 葛加走之底读什么 在等腰三角形ABC中,AB=AC=5,BC=6,求角B的三角函数值 ...人开走一架战斗机,在一架客机下面飞,好几个飞机来拦截, ...话是三架飞机 机型各不同 在山区飞行发现恐怖分子用驴车运核弹 用AK... ...的成为战斗机飞行员。战争结束回国继续抢银 领导干部配偶应该吹什么样的"枕边风 梯度上升算法与梯度下降算法求解回归系数怎么理解 苹果5s开机充电 电量不提升。怎么解决 为什么“枕边风”也能把事“吹”成? iphone 5s有时充电时显示的是正在充电,但是电量百分比一直不动是怎么回事? 耳边风永远吹不过枕边风这个你都懂是什么意思? iPhone5s充电充到87%就不涨了 从了一天还是一样 怎么回事 老板女朋友在我手下做业务员,并且总吹枕边风应该怎么办? 苹果5显示充电,但是电量不涨,是怎么回事 注册京东企业购需要什么啊? 不是枕边上却可以吹枕边风,是什么意思? 苹果5s显示充电但电量不变,充不进电,怎么回事? 为什么安卓系统安装微信多开后电池太费电了?怎么解决可以省电? 苹果5s充电冲不满,怎么回事? 微信多开器,开久了,总是会出现广告是什么意思呢 苹果5s充电充不满,怎么回事? 柠檬薄荷糖醋排骨怎么做 杨广夺太子位,是因为独孤皇后吹的枕边风吗? 麻烦问一下我苹果5s充电,充电图标正常,就是电量一直不增是什么原因 电脑微信双开重启怎么没了 都说枕边风最能让男人听话,那该怎么吹呢 苹果5s充电为什么充不满!! 企业的安全生产目标是什么? 企业安全生产管理目标主要包括哪五部分内容? 枕边风 ﹦耳边风﹖ 用matlab实现梯度下降算法(gradient descent)。 怎么成为京东企业会员,可以免费注册吗? 苹果5s充电充不满怎么回事 "枕边风"到底是褒义词还是贬义词啊? 企业安全生产管理目标主要包括哪五部分内容 梯度下降法是什么意思? 苹果5s电量用光了,然后充电就充不进去了是怎么回事啊,开不了机了 苹果5s显示充电却不增长怎么办? 建筑施工企业安全管理目标 梯度下降的求解过程 苹果5s手机显示充电但充不进去电是什么原因 安全生产目标管理的内容有哪些 python实现梯度下降 安全生产管理目标可分为哪四个阶段 iPhone 5S长时间没用,现在充电没反应怎么办?