问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

NVIDIA-Merlin: 基于GPU的推荐系统训练和推理全套方案

发布网友 发布时间:2024-10-21 19:45

我来回答

1个回答

热心网友 时间:2024-12-04 07:24

本文将介绍 NVIDIA 推荐系统产品 Merlin。

本次介绍将围绕以下五点展开:

1. Merlin 产品概览

2. Merlin Models & Systems

3. Merlin Distributed Embeddings(TFDE)

4. 底层库:Merlin Hierarchical-KV

5. 推理的层次化参数服务器:Merlin Hierarchical Parameter Server(HPS)

分享嘉宾:王泽寰 NVIDIA 开发经理

编辑整理:闫玉芳

内容校对:李瑶

出品社区:DataFun

01 Merlin 产品概览

Merlin 产品包含 Merlin Models 和 Merlin Systems,这是一套高层的工具,旨在简化推荐系统模型的部署和开发。

下图中高亮的四个部分是本次分享的重点,下面将依次展开介绍。

02 Merlin Models & Systems

1. Merlin Models

Merlin Models & Systems 是一个高层的库,便于用户以简单、快速的方式部署推荐系统模型,主要面向对推荐系统开发经验较少的用户。

Merlin Models 的功能类似于 Model Zoo,包含多种推荐系统经典模型,如 * DLRM、Google DCN、* DNN 等。

2. Merlin Systems

Merlin Systems 主要简化推理和线上部署的过程,帮助用户简化配置,快速部署上线。

上图中的代码展示了具体的实现,只需不到50行的代码就能完成部署上线。

03 Merlin Distributed Embeddings(TFDE)

TFDE 是针对 TensorFlow 设计的一个插件,提供了 Embedding API,用于加速 Embedding 的查找更新过程。

TFDE 提供了很好的加速效果,即使在小模型下也能实现显著的加速。

TFDE 的使用方法很简单,只需按照以下步骤进行修改:

1. 构建模型时,更改 embedding layer。

2. 修改 training step 中的数据交换部分。

3. 做 embedding 的初始化时,将参数初始化在不同的 GPU 里。

04 Merlin Hierarchical-KV

Merlin Hierarchical-KV 是位于 Merlin 最底层的 C++ 库,完成 key、value 的基本操作。

该库支持分布式、层次化的内存,支持 eviction,适用于推荐系统训练场景,具有以下优点:

1. 支持 CPU 和 GPU 存储的结合。

2. 性能优越。

3. 支持 eviction。

4. 性能稳定。

5. 易于集成到不同的训练框架中。

05 推理的层次化参数服务器:Merlin Hierarchical Parameter Server(HPS)

HPS 用于加速推荐系统中的推理过程,利用 GPU cache 加速 Embedding 查找,减少 CPU 参数服务器的压力。

HPS 针对不同的场景设计了 plugin,包括 TRT plugin、PyT plugin 以及 HPS on Triton Ensemble,具有很好的加速效果。

在训练过程中,可以使用 Kafka 将增量的模型推出来,推到线上的服务器,HPS 可以使用小步快跑的方式,将 embedding 进行一个少量的迭代,进行一些替换,从而降低推理的延迟。

以上就是本次分享的内容,谢谢大家。
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
胜达这款车百公里油耗多少? 胜达节能油加盟办厂可靠吗是不是骗子 河南洛阳胜达就是骗子,我把钱交了也不来人了,他们一个老总说了爱咋办... 胜达油是个骗局吗 胜达节能油是什么? 叩解度关于叩解的论述 湿重跟湿重有关的打浆磨片 戴尔XPS M1330-950重要参数 如果到别的单位去面试的话 如果人家问起为什么会选择这家公司而离开另外... 学生会被两个部门同时面试怎么办 我在雅虎有邮箱,我又把它设置到Outlook express里了 ...把一个一维数组中最大的数和第一个数调换,最小的和最后一个数调换... ...一维数组找出其中的最大值让其与第一个元素交换,找出最小值与... 高性能钢材在钢结构中的应用内容简介 1.我的OUTLOOK老是设置不成功,发邮件时老是要确认用户名和密码_百度... 疾病相关基因整合信息数据库内容简介 ...数组,编程实现一维数组中最小元素与第一个元素的互换 HPS缩写代表His-Purkinje system,它在医学领域有何应用? 求一维数组中各元素之和、最小数组元素,并将最小数组元素与数组中第一... "HPS”代表什么? 雅虎邮箱在outlook上的设置问题 对佘祥林冤案监狱需要承担责任嘛?大家怎么看 佘祥林案时间表 我是重庆一高三学生,现在单招想选择建筑装饰专业,但是对面试有点不... 助产和护士哪个好? 哲学的最高境界是怎样? 我和我老婆离婚的的话还子会判给父亲还是母亲?孩子一岁多了。 ...吃了两大碗米饭。又吃了点儿冬瓜炖羊肉。吃饭前两体重是114斤。吃完... 安徽博物馆文物有哪些 哲学的最高境界是 35岁去东莞打工怎么样?脑子转得快,学东西也快,这年纪工厂还招吗? excel表格数据自动统计问题,请大神们帮忙解决下吧 草原法中华人民共和国《草原法》 草原法是什么法 你想看男朋友手机聊天内容,你会直接叫他给你看吗? 杉木板和免漆板哪个好,有啥优点 哈尔滨军立街手机店 我在军立街130号 想找一个离这最近的三星手机店... 农行为什么下载好证书再登陆个人网上银行证书登陆时出现网页无法显示... ...银行的网银业务而且也下载了安全证书,但为什么每次交易时还是说需... 求黑龙江各品牌手机的代理电话,地址,联系方式,简介 建行个人网上银行为什么我进不去,密码帐号都对,它说错误代号:C03002这... 保卫萝卜3公园第6关攻略 公园第6关怎么过 完成时动词是用过去分词吗? 今年511分报考河南农业大学有望吗? 我是河南理科考生,比二本线低五分,能上二本院校吗 我是河南考生,今年文科高考成绩是510低河南一本线3分能报考烟台大学二本... 你好,我是河南文科考生,今年考了503,比二本线低6分。请问可以上河南农业... 以前开几个窗口最小化后,把鼠标放在任务栏的E上,会出现很多小框框,里 ... 窗口最小化之后的问题 高手进 在线等 任务栏怎么变透明(win7任务栏怎么变透明)