比较Adam 和Adamw - 迅易阁资讯

分享好友最新动态首页最新动态分类切换频道

比较Adam 和Adamw

2024-12-28 04:13

引用自： https://www.lizenghai.com/archives/64931.html

AdamW是在Adam+L2正则化的基础上进行改进的算法。
使用Adam优化带L2正则的损失并不有效。如果引入L2正则项，在计算梯度的时候会加上对正则项求梯度的结果。

那么如果本身比较大的一些权重对应的梯度也会比较大，由于Adam计算步骤中减去项会有除以梯度平方的累积，使得减去项偏小。按常理说，越大的权重应该惩罚越大，但是在Adam并不是这样。

而权重衰减对所有的权重都是采用相同的系数进行更新，越大的权重显然惩罚越大。

在常见的深度学习库中只提供了L2正则，并没有提供权重衰减的实现。

图片中红色是传统的Adam+L2 regularization的方式，绿色是Adam+weightdecay的方式。可以看出两个方法的区别仅在于“系数乘以上一步参数值“这一项的位置。

再结合代码来看一下AdamW的具体实现。

以下代码来自https://github.com/macanv/BERT-BiLSTM-CRF-NER/blob/master/bert_base/bert/optimization.py中的AdamWeightDecayOptimizer中的apply_gradients函数中，BERT中的优化器就是使用这个方法。

在代码中也做了一些注释用于对应之前给出的Adam简化版公式，方便理解。可以看出update += self.weight_decay_rate * param这一句是Adam中没有的，也就是Adam中绿色的部分对应的代码，weightdecay这一步是是发生在Adam中需要被更新的参数update计算之后，并且在乘以学习率learning_rate之前，这和图片中的伪代码的计算顺序是完全一致的。总之一句话，如果使用了weightdecay就不必再使用L2正则化了。

最新文章

通化网上预约驾照考试系统入口如何操作

L代表LOW的意思，也就是低速档，和数字档1档是一个意思，都是为了把档位限制在最低，从而为了得到大扭矩而不升档。2代表档位限制在1档和2档之间，用于湿滑路况的起步或慢速前进时限制档位的作用。在冰雪路面或遇到堵车时，由于车辆行驶缓慢

拷贝漫画官方正版

拷贝漫画App官方正版是一款拥有海量漫画资源的App，大家在这里可以随时阅读任何漫画内容，App提供多种漫画类型，冒险、奇幻、科幻、校园、爱情等等，无论是日漫、韩漫还是美漫这里应有尽有，还有很多丰富的轻小说可以阅读，漫画小说二合一

巨量千川广告代投／巨量千川／巨量千川直播广告

2018年12月05日李丹竹100今日头条巨量引擎，快-手磁力智投和磁力金牛，小红书，广点通，视频号等等信息流广告投流开户代运营，直-播带货推广网络技术的研究、开发;广告业;软件服务;软件测试服务;软件批发;软件零售;软件开发;计算机技术开发

局域网监控软件排行榜｜2024年底局域网监控软件精选！

企业信息化程度的不断提高，局域网监控软件在保障数据安全、提升工作效率方面发挥着越来越重要的作用。2024年底，市场上涌现出众多优秀的局域网监控软件，为企业提供了丰富的选择。这篇文章将为您精选几款功能强大、用户评价高的局域网监控

运营总监的岗位职责要求(十四篇)

每个人都曾试图在平淡的学习、工作和生活中写一篇文章。写作是培养人的观察、联想、想象、思维和记忆的重要手段。写范文的时候需要注意什么呢？有哪些格式需要注意呢？接下来小编就给大家介绍一下优秀的范文该怎么写，我们一起来看一看吧。

讯飞AI公文写作：一键打造专业公文新体验

标题：讯飞AI公文写作：一键打造专业公文新体验随着科技的不断发展，人工智能已经逐渐渗透到我们生活的方方面面，为各行各业带来了巨大的变革。在公文写作领域，讯飞AI公文写作系统以其高效、智能的特点，成为众多企事业单位和政府部门的首

黑湖小工单：生产报工系统，实时监控车间动态。

黑湖小工单：一款轻量型移动生产报工系统，将生产各阶段的数据及时、准确地采集并发送到后台数据库中，使繁杂的采集数据工作从人工转化由机器系统快速、准确地完成。不仅为生产部门提供真实可利用的生产数据，也为相关管理人员跟踪生产进度

科大讯飞携手中国银行四川省分行探索服务创新，多语种AI透明屏亮相天府机场

日前，AI技术助力四川省分行（以下简称“四川中行”）积极探索服务创新，在天府机场境外来宾支付服务中心率先应用科大讯飞多语种AI透明屏，为保障境外来华人士支付便利性技术升级，服务提质。四川中行创新上线的科大讯飞多语种AI透明屏，是

撸包广告小游戏APP搭建加盟

在数字化时代，手机APP已经成为我们日常生活中不可或缺的一部分。从购物、娱乐到学习，各种各样的APP为我们提供了极大的便利。而在这个广阔的市场中，撸包广告小游戏APP搭建加盟成为了一种新的创业机会。那么，如何利用这个机会开启你的创

百度如流办公软件app

百度如流办公软件app，一般又称如流app,infoflow。

相关文章

推荐文章

消费电子：端侧AI风起云涌，眼镜终端系最佳落地场景之一

谷歌推广竞价广告费用如何预估？

第三届全国检察机关十佳文化品牌·检言漫语

邻家新妻最新章节珊珊，详细步骤指南与精彩内容揭秘

portainer（1）：使用 1.22.0 版本，二进制搭建服务端环境，修改端口，agent连接成功

喜羊羊与灰太狼之筐出未来#高燃混剪#筐出未来#动画#喜羊羊灰太狼

极氪汽车的智能化配置丰富吗

淘宝自然搜索排名被影响到的原因都有哪些？

高清美女写真神器！用AI一键生成你的梦中女友，快来试试！

发表评论