开发者社区> 小周sir> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

【AI征文】对DeepRec认识以及了解

简介: 对DeepRec认识以及了解
+关注继续查看

6d7409a8f341416abf0e20c18741a6aa.png

DeepRec(PAI-TF)是阿里巴巴集团统一的大规模稀疏模型训练/预测引擎,广泛应用于淘宝、天猫、阿里妈妈、高德、淘特、AliExpress、Lazada等,支持了淘宝搜索、推荐、广告等核心业务,支撑着千亿特征、万亿样本的超大规模稀疏训练。DeepRec在分布式、图优化、算子、Runtime等方面对稀疏模型进行了深度性能优化,同时提供了稀疏场景下特有的Embedding相关功能。

DeepRec业务场景

v2-ff0f05f6cc19f4a8401580cf2a5e3e7e_r.jpg

  • DeepRec在阿里内部使用的核心的业务场景主要就是猜你喜欢、主搜索,还有广告的直通车和定向。

DeepRec主要包含以下几类:

v2-1ec26021e6655b980e6d16de5ece2d4c_r.jpg

  • 动态弹性特征
  • 基于特征频率的动态弹性维度
  • 异步训练框架StarServer
  • 同步训练框架HybridBackend
  • Embedding多级混合存储
  • 图优化-结构化特征
  • Runtime优化-PRMalloc

#### DeepRec架构设计原则

  • DeepRec采取了另一种架构设计方式,遵循“视整个训练引擎为一个系统整体”的架构设计原则。TensorFlow是一个基于Graph的静态图训练引擎,在其架构上有相应的分层,比如最上层的API层、中间的图优化层和最下层的算子层。TensorFlow通过这三层的设计去支撑上层不同Workload的业务需求和性能优化需求。

DeepRec也坚持了这一设计原则,基于存储/计算解耦的设计原则在Graph层面引入EmbeddingVariable功能;基于Graph的特点实现了通信的算子融合。通过这样的设计原则,DeepRec可以支持用户在单机、分布式场景下使用同一个优化器的实现和同一套EmbeddingVariable的实现;同时在Graph层面引入多种优化能力,从而做到独立模块设计所做不到的联合优化设计。

DeepRec的优势

  • DeepRec是基于TensorFlow1.15、Intel-TF、NV-TF构建的稀疏模型训练/预测引擎,针对稀疏模型场景进行了定制深度优化,主要包含以下三类功能优化:
    1.模型效果
    2.训练性能
    3.部署及Serving

大规模稀疏模型的应用是搜、推、广等多业务领域所面临的重要课题,阿里巴巴DeepRec模型在业界已有训练引擎、框架的基础上探索出了一套行之有效的实践方案,在特征使用、模型训练、线上推理、存储等方面都进行了一定的探索和优化。DeepRec希望在自身开源的过程中与业界伙伴一起更好地解决大规模稀疏模型应用的问题。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
Docker安装rocketMQ集群之挂载方式安装
Docker安装rocketMQ集群之挂载方式安装
81 0
RMSD:通过旋转计算两个分子间的最小rmsd
RMSD:通过旋转计算两个分子间的最小rmsd
102 0
云计算认证哪个含金量高,ACP认证分类
学习使人进步,如果您是爱学习的小伙伴,而且您又是从事互联网行业工作的朋友,那您听说过一个叫做acp的证书吗?这个证书可谓是火爆全网,云计算认证哪个含金量高您知道吗?当然是acp证书,acp证书有哪几种分类呢?一共有五种分类,下面小编就给您介绍一下,这五个分类分别是云计算认证、大数据认证、数据分析认证和云安全认证,您可以根据自身情况报考。或者您也可以咨询认证大使哦,我们可以为您提供建议。
162 0
Apache Spark™ 3.0中全新的Structured Streaming UI
Spark 3.0中新的Structured Streaming UI会提供一些有用的信息和统计数据,以此来监视所有流作业,便于在开发调试过程中排除故障。同时,开发者还能够获得实时的监测数据,这能使生产流程更直观。
2733 0
《伸手系列》之Docker开启2376端口CA认证
前言 众所周知,docker可以开启远程访问API,但是发现很多都是直接开启2375端口,未做安全配置,从而出现安全隐患,最近在将docker环境统一portainer管理时,发现有这种情况。本文讲解如何开启安全认证的方法,配置TLS保证API的安全。
1679 0
Spark Streaming 的玫瑰与刺
Spark Streaming 的好处与坑
1863 0
㉔云上场景:瑞云科技,支持Render cloud的超强计算
阿里云与瑞云科技共建的Render cloud已上线试运行,成为国内最大的云渲染平台,将影视渲染速度提升数千倍,小型制作团队也能实现"好莱坞级"的特效水平。
3831 0
+关注
小周sir
面对过去,不要迷离;面对未来,不必彷徨;
74
文章
86
问答
文章排行榜
最热
最新
相关电子书
更多
低代码开发师(初级)实战教程
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载
冬季实战营第三期:MySQL数据库进阶实战
立即下载