问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

机器学习故事汇-梯度下降

发布网友 发布时间:2022-04-22 04:38

我来回答

1个回答

热心网友 时间:2023-07-07 19:03

机器学习故事汇-梯度下降
今天咱们的故事继续上一次线性回归来说,还不熟悉的小伙伴机票在这!机票直达-线性回归

当时咱们怎么唠的,是不是很多情况下要求解的目标没办法直接求呀!那该怎么办呢?咱们来用机器学习中最常用的套路-优化求解,也就是一步一步朝着最优解的方向前进!

首先给出目标函数(还记得线性回归中的目标函数吗?)也就是我们要达到的目标是使得目标函数最小(最小对应着梯度下降问题,也就是下山,那么最大也就是梯度上升,求极大值)可以把我们的优化目标看成一座山,山是由我们两个参数组成的,从上图可以看出在山中有一个山谷的最低点,这个最低点所对应的参数就是我们要求解的值!
那该怎么求解呢?下山要一步一步来,第一步要找到合适的下山方向,也就是参数所对应的梯度方向(偏导)因为我们要沿着最快的方向去下山,所以梯度的方向是最合适的(多个参数的时候需要各自求其偏导)。找到方向之后我们就该实际的去走啦,那一次走多大呢?经验表明一次走那么一小小小小步是比较合适的,因为如果步伐太大容易偏离全局最优解只得到局部最优解。方向与步长都搞定了,接下来按着我们设计好的路线更新参数就可以啦!

下山的方式也有很多种,我们来对比一下。
批量梯度下降:如上式需要综合考虑所有养那本,这就太慢了,但是效果还是蛮好的。
随机梯度下降:观察发现,每一次进行参数更新,只选择了一个样本,这样速度极快,但是代价就是一旦样本有瑕疵,会对结果产生很大的干扰!所以随机梯度下降会产生很大的浮动。
小批量梯度下降:这个就友好多了,综合了上面两位的优缺点,在迭代的时候选择一批(32,64,128比较常见)个样本来平均计算梯度的更新方向,这个就是现在应用最广的梯度下降方法啦!一个字,实用!

接下来我们再来研究一下步长(学习率)对结果产生的影响,从图中可以看到很多条线并且它们之间有着明显的差异,为啥模型不收敛!效果不好!没达标!罪魁祸首就是学习率了,它对我们结果会产生非常大的影响,一般情况下我们都是用较小的学习率,较多的迭代次数来满足它!

这张图是一个在真实数据集下使用逻辑回归进行迭代的目标函数变化情况,可以看到当我们使用梯度下降的时候目标函数最终达到了一个收敛状态,现在已经最好了吗?我们可以再增大些迭代次数再看看!

继续增大迭代次数,发现目标函数又发生了变化,所以要让模型更完美,需要更多轮次的训练!我们再来对比下不同的梯度下降策略!

这张图看起来有点乱呀,没有达到熟练状态,损失函数值还在乱蹦跶,这个就是随机梯度下降的结果,可以看出来这样的模型是不好的,只用一个样本来更新参数是不够的!所以现在我们很少使用随机梯度下降来解决实际问题。(那真的没办法用它了吗?也可以代价就是用极小的学习率配上极大的迭代次数,那为啥不用小批量的呢?)

最后的这张图就是收尾图啦,首先观察只用了4000次迭代就比之前的效果要好很多!这里做了如下两个工作。
(1):对数据进行了标准化,让数据各个特征均值为0方差为(数据预处理的常规套路)
(2):使用了小批量梯度下降进行迭代(保证了收敛性同时也加快了速度)
两个简单的操作就使得我们的模型效果快速达到了收敛状态,请记住这俩套路,你会一直沿用下去的!
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
形容手表很舒服的句子 情侣手表的对话句子 租门面和房东鉴了十年合同,房东要退店面,我可以不退吗,继续经 ...一篇朝花夕拾里十篇小短文的主要内容及作者的情感和主要人物的... 什么叫狼狗 狼狗的生活习性有哪些? 起个姓罗好听的宝宝名字 野火的近义词 个是词语解释 请旌词语解释 随机梯度下降算法的相关应用 上海有哪些小额投资理财公司 上海有哪些做股票的公司? 我微信朋友圈的头像为什么看不见 手机上微信看不到朋友头像是什么情况 手机微信聊天怎么看不到自己的头像 怎样用色彩范围抠图 在PS里面怎么用色彩分离抠图 coreldraw中如何用提取颜色的方法抠图 图片抠图一般有哪几种类型的边缘?各使用什么方法将... ps怎样抠图补色 ps色彩相近怎么抠图 ps的利用颜色怎么抠图 photoshop怎样按颜色抠图 pr怎么根据颜色抠图 简述水浴式灭菌器的结构和原理? 实验室仪器设备的配置原则? 水质分析仪的水质指标 水质分析的指标 使用恒温水浴锅需要注意哪些?求答案 在R里应用梯度下降方法gradient descent 牛顿法为什么比梯度下降法求解需要的迭代次数更少? 梯度下降法和粒子群优化算法的区别 随机并行梯度下降算法的算法流程 手表表盘可以自己换吗 数据统计学习的5个基本流程 我的手表表带,表面一层是帆布的,里面一层是皮带... 优化算法有哪些 怎样换手表表盘 关于机器学习应用不得不思考哪些问题? 实际工程中的优化算法主要有哪些 国家卫生城市考核命名和监督管理办法的内容 手表怎么换镜面 用什么工具 操作步骤是什么? 常见的监督学习算法 手表机芯如何更换 少食多餐怎么操作? 手表带更换如何知道它的尺寸 图像处理中应用的寻优算法有哪些 黑龙江省基层医疗卫生机构实施绩效工资试点考核办法 白菜的做法有多少种