问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

深入理解GBDT、XGBoost、LightGBM系列(二)

发布网友 发布时间:2024-10-02 04:04

我来回答

1个回答

热心网友 时间:2024-11-23 05:04


深入理解GBDT原理后,XGBoost的跟进学习变得相对简单,尽管基础框架保持一致,但在具体实现上如树结构分值计算有差异。参考论文,你会发现XGBoost中的gamma、eta等参数与公式直接对应。


XGBoost的流行程度无需赘述,即使在2021年的竞赛分享中,多数人仍首选树模型(XGBoost和LightGBM)解决问题,因其易用性和优秀性能。有了上文关于boosting算法的加性模型理解,我们将结合XGBoost的经典论文,深入探讨其实现细节,以期提供更深入的见解。


遵循经典机器学习思路,本文将基于论文和参考资料[1],逐步揭示XGBoost框架中的智慧,从模型构建到算法优化。


模型


首先,定义使用回归树的梯度提升算法,数据集包含n个样本,每个样本有m个特征。加性模型预测如公式(1),通过每个树结构q和叶子权重w构建模型,整个过程可以用图示。


回归树的叶子节点分值用公式表示,预测值则是所有叶子节点的加总。目标函数包括正则项,以避免过拟合,如公式(2)所示。


算法优化


在XGBoost中,通过前向分步法,以公式(3)表示预测值的迭代过程,损失函数在此基础上演化。损失函数优化采用二阶泰勒展开,引入梯度近似,目标函数仅依赖于一阶和二阶导数,如公式(8)所示。


特征选择和切分点选择依赖于公式(13),通过计算增益来决定最佳*。XGBoost中的gamma参数与这个过程紧密相关,如图所示。


防止过拟合的策略包括剪枝和列采样,剪枝参数eta类似梯度下降的步长。XGBoost的*算法有精确和近似两种,后者支持分布式训练和特征处理。


工程优化


论文中详细阐述了XGBoost的高效系统设计,如列块的并行处理、精确和近似算法的优化策略,以及对硬盘和内存的高效利用。这些优化使得XGBoost在实际应用中表现出色。


最后,本文大量引用了[1],深度解析了关键概念,旨在帮助读者深入理解XGBoost的原理和实现。


声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
苹果手机微信怎么换漂亮字体(苹果手机微信怎么换行输入) 有什么好用的app转换字体 手写转文字的软件 erp可以看评论地址吗 淘宝评论url是什么意思? 揭秘:码牌支付风控升级,背后真相揭秘 电脑电视直播软件哪个好用什么软件好电脑看电视直播 潼南子同街学区是哪些 三极管BU406价格和参数? 火锅料放在冰柜忘了插电一个星期给会坏了吗 火锅的设备有哪些 XGBoost算法的原理详析[文献阅读笔记] XGBClassifier demo XGBOOST 解析 XGboost--实操总结(步骤&参数&问题点) yy漫画怎么登陆不上? 再读xgboost和LightGBM 当代世界政治经济热点问题内容简介 ...当今世界政治面临哪些主要问题?第二题,战后政治格局是怎样发展演变... 出自琵琶行的成语 苹果6s手机看今日头条,为何只能打开标题就不反应了 劳动合同的六十八条的具体内容是什么? 中华人民共和国劳动合同法68条的内容是什么 华为三折叠屏手机怎么抢 华为最贵的折叠手机 华为三折叠屏手机在哪里抢 为什么不推荐购买华为折叠屏? ...分享互联网"这样的网站来下载高清的电影啦 哈弗H6 Coupe求教,车子最近档位降下来很慢是什么原因 ...相向而行甲车每小时行50千米,乙车每小时行40千米,当甲车驶过ab距离... ...相向而行,甲车每小时行50千米 乙每小时行40千米相遇时甲 长帝烤箱好吗? 福州群英众创空间管理有限公司怎么样? ...her class.A any other girl B any other girls C any others... ...以及对它操作的详细介绍?它是基于还原卡工作的吗? 我装了方正二合一保护卡,换了硬盘无法启动,为什么 方正还原保护卡软件版 v2.10 两台电脑同传和多台电脑同传用的时间一样吗 工商银行工银灵通卡我办20元啊 开店做什么生意最旺人气 小本生意做什么比较好 现在什么生意好做利润高,投资小利润高的小生意_自己创业干点什么好,投 ... 现在能做什么生意 夜宵街什么生意最旺人气 五一去贵阳应该带什么衣服? 五一想去贵阳玩,会不会像别的城市一样受到节日的影响很严重呢? 我的贷款已经还上,但我的信用污点没有消除。只不过是晚了几天的时间... 北京路到广州市第四十中学怎么走 广州越秀区40中什么时候放学呀? 广州市第四十中学校园建设 ...变得很卡 也会死机 杀毒软件自动关闭 中什么病毒了?