AI·OS新探索:端到端算法工程平台

本文涉及的产品
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
智能开放搜索 OpenSearch向量检索版,4核32GB 1个月
推荐全链路深度定制开发平台,高级版 1个月
简介: 本话题将围绕深度算法学习工程,详细介绍在淘宝搜索,推荐,广告业务的最佳实践,和大家详细阐述,阿里是如何构建一个高效的端到端AI算法平台。

特邀嘉宾:张迪--阿里巴巴集团资深技术专家
视频地址:https://yunqi.aliyun.com/2020/session54?liveId=44646

AI驱动淘宝搜索、推荐、广告技术的深入发展

今天你在淘宝上所看到的大量的内容,都已经是千人前面的个性化,其中搜索推荐广告业务作为核心的内容分发形态,在这其中发挥了重要的作用。在过去的5年,以深度学习技术为代表的AI技术成为搜索推荐广告业务突破的核心驱动力。深度学习的核心要素是算力、算法和数据,如何构建一个高效的端到端AI平台,直接决定了业务的天花板和迭代进化效率。
image.png

1.算力需求持续提升
在AI 算法越来越智能的背后,是对于算力需求的持续提升。
• 从算法视角来看,算法工程师希望可以像搭积木一样自由进行模型设计组装,并且快速进行效果验证,从而模型复杂度也越来越大,其中包含稀疏理解表征,持续行为刻画以及全连接网络的各种网络结构的负荷
• 从计算规模角度看,模型规模达到百亿特征,千亿参数,模型大小达到TB量级,对模型训练和在线模型预估都是巨大的挑战。
image.png

2.算法多样性的提升
算法多样性越来越高,标准的DNN模型以外,图声音网络、强化学习、基于树的深度学习等技术也在淘宝的业务中得到了广泛的应用。

• 图声音网络可以刻画用户和商品之间的连接,从而使用GraphEmbedding技术提升商品召回能力;
• 强化学习技术优化广告中的OCPC智能出价,从而使广告组的每一分钱花的更加精准;
• Tree-based Deep Match技术在广告召回功能,融入了更强大的模型刻画能力。

端到端的算法平台

算法的复杂度、多样性都越来越高,这一切都需要一个高效的端到端算法平台来保障。
1.3个维度的优化目标

AI算力的无限需求
持续的释放深度学习的算力,从而推高算法效果的天花板;
加速迭代效率
端到端的一致性体验,保障算法的全流程迭代效率;
赋能算法创新
平台设计要有足够高的灵活性,支持算法形态的持续创新;

2.AI·OS大数据深度学习工程技术体系
AI·OS作为大数据深度学习工程技术体系,发展至今包括AIOfflinePlatform(一站式建模平台)和AIOnlineServing(AI在线服务体系),在离线系统无缝链接,构成了端到端大数据AI智能引擎。目前支撑起海内外阿里电商全部的搜索、推荐、广告业务,时刻置身大数据主战场,引导成交占据集团电商大盘主体;此外,作为中台技术中坚,AI·OS已是包括电商、阿里云、优酷、菜鸟、盒马、钉钉等等在内全集团的基础设施,更为重要的是,AI·OS体系的云产品(开放搜索和智能推荐)矩阵通过阿里云服务于全球开发者。
image.png

3.工业级机器学习解决的问题
工业级机器学习解决的问题的复杂性不单是关注算法模型的代码的开发,而是一个涉及在离线闭环的,包括特征、样本,模型的全链路问题。
image.png

4.一站式建模平台
面向搜索、推荐、广告这样的场景,开发了一站式建模平台,提供包括特征管理,样本组装,模型训练与评估,模型交付的全链路端到端的能力。

一站式建模平台底层基于KubeFlow云原生底座,提供批量学习 (Batch)和流式学习(Online )的能力。
XFC提供标准化特征的管理和动向,Channel是样本计算的概念抽象,Model center是模型工厂部分提供的模型训练、模型共享、模型交付。
image.png

模型分析系统多维度模型可视化分析和模型安全性的校验,基于这些的逻辑抽象,算法工程师不需要关注底层系统的运行,只要编辑算法流程的逻辑描述,即可实现的算法流程的开发部署以及线上运维。在此基础上平台内建了统一的计算存储的血缘管理,基于此关系,以及算法逻辑描述的分析,平台有一套计算存储编辑优化层,可以自动的进行特征、样本、模型数据的共享和计算存储的优化。例如:当我们发现2组算法实验流程特征重合度很高时,我们的系统会自动合并两组特征计算和存储,大大提升整个平台的存储效率。
通过以上平台级赋能更多的业务创新可以实现更低的成本实现工程实施与效果验证,从而实现产品创意到算法,到工程的快速迭代循环。

批流一体的在线深度学习解决方案

随着对着业务时效性的追求越来越强,在线深度学习技术越来越重要。为此我们提供了批一体的在线深度学习解决方案,使得模型可以实时更新,业务则可以及时的捕捉用户的行为变化。

1.什么是批流一体
就是可以用一套算法逻辑描述既可以进行天级的批量学习,也可以进行在线实时学习,这样可以大幅减少算法流程开发的复杂度,还可以保障全量模型和实时模型之间的一致性。

• 基于Blink进行特征样本的实时计算,得益于Blink强大的计算能力,可以提供百万级QPS的流失样本的高可靠计算,基于XDL深度学习框架模型进行深度实时训练,同时可以提供高可靠的实时模型校验能力,最后把模型实时变化的更新成RTP在线模型服务,最快可以提供端到端的分钟级模型更新能力,在阿里的搜索、推荐、广告业务上发挥巨大作用,大幅度提升了系统时效性。

image.png

2.XDL:高维稀疏训练引擎
深度学习的算力的提升,主要提现了两个关键环节

  1. 深度模型训练的效率;
  2. 深度模型在线预估的效率;
    搜索推荐广告是高维稀疏的场景,特征规模和参数规模高达百亿、千亿量级,模型呈现既宽又深的特点,需要同时进行宽度计算优化和深度计算优化.

image.png

XDL是面向高维稀疏场景打造的分布式深度学习训练框架
• 进行大量的分布式模型优化,重新设计高性能的参数服务器,基于实时统计的动态参数放置策略,消除参数服务器的计算热点,同时实现优雅的分布式容灾策略,以便进行更高效的高并发训练。
• 在计算加速上,进行大量分布式计算图优化,包括高性能数据处理流水线,稀疏算子融合,参数交换的通信合并,极致的计算和通信的异步化等。一系列优化使得XDL可以支持数百亿特征,数千亿参数,千级数据平行的分部署式高维稀疏训练,优秀的自动分布式能力和自动流水线能力使得模型开发人员无需关心底层的细节,只需关注自身的模型开发逻辑即可;
• 在高层范式层面,XDL支持良好的结构化训练和流式训练能力,结构化训练是指利用搜索推荐广告场景下互联网样本结构化的特点,充分减少前项计算和后项计算,大幅提升训练效率。

3.RTP:分布式预估服务
RTP,作为AIOS提体系的分布式深度学习预估服务,将机器学习在线预测能力模块化提供了强大的模型应用编排能力,使得机器技术可以应用到搜索推荐广告在线服务的全链路中,包括召回,精排,重排以及摘要选取等各个环节。
RTP还可以提供分布式模型和分布式特征之间的全量一致性切换语义,也可以支持TB级别模型的在线服务。
• 深度模型的在线推理效率是至关重要的,需要在一定延迟约束下,进行大量深度学习的计算,为此在推理异构计算方面RTP集成了专门的异构推理计算加速引擎,可以同时支持FPG、CPU、GPU、阿里NPU等各种各样的异构硬件,为业务在深度学习领域提供了巨大的算力;
• 从离线训练的模型到在线预估模型,整个交付环节是也很重要,在这个过程中,需要对模型进行量化压缩,模型计算图改写逻辑,从而保证模型的在线推理逻辑的最大化。
image.png

总结

为了支持算法快速的迭代,淘宝构建了一套在离线闭环的端到端算法平台,使得算法解决方案可以在不同场景之间快速复制与迁移,针对核心的训练引擎和预估引擎,结合搜索推荐广告的高维稀疏的特点, 进行深入的场景优化,使得AI算法可以充分利用算力来推升算法效果的天花板。


以上就是本次云栖大会--“阿里是如何构建一个高效的端到端AI算法平台”的内容。如果您对搜索与推荐相关技术感兴趣,欢迎加入钉钉群内交流~


image.png

【开放搜索】新用户活动:阿里云实名认证用户享1个月免费试用https://free.aliyun.com/product/opensearch-free-trial

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
5天前
|
机器学习/深度学习 人工智能 搜索推荐
AI低代码平台:创新开发新选择
Zoho Creator、Airtable、Appian、Creatio Atlas及织信等低代码平台,通过集成AI功能如预测分析、情感分析、自动化文案创作等,显著提升了开发效率与智能化水平。例如,Zoho Creator利用AI预测客户需求并分析情绪;Airtable借助OpenAI模型自动生成代码与文案;Appian通过AI技能自动处理文档与邮件;Creatio Atlas运用AI优化决策流程并提供个性化推荐;织信则集成ChatGPT与Stable Diffusion,实现智能开发与图像生成。这些平台不仅支持多种业务场景,还简化了应用程序开发流程。
20 5
|
1天前
|
存储 人工智能 自然语言处理
无缝融入,即刻智能[二]:Dify-LLM平台(聊天智能助手、AI工作流)快速使用指南,42K+星标见证专属智能方案
【8月更文挑战第8天】无缝融入,即刻智能[二]:Dify-LLM平台(聊天智能助手、AI工作流)快速使用指南,42K+星标见证专属智能方案
无缝融入,即刻智能[二]:Dify-LLM平台(聊天智能助手、AI工作流)快速使用指南,42K+星标见证专属智能方案
|
7天前
|
编解码 算法 Linux
Linux平台下RTSP|RTMP播放器如何跟python交互投递RGB数据供视觉算法分析
在对接Linux平台的RTSP播放模块时,需将播放数据同时提供给Python进行视觉算法分析。技术实现上,可在播放时通过回调函数获取视频帧数据,并以RGB32格式输出。利用`SetVideoFrameCallBackV2`接口设定缩放后的视频帧回调,以满足算法所需的分辨率。回调函数中,每收到一帧数据即保存为bitmap文件。Python端只需读取指定文件夹中的bitmap文件,即可进行视频数据的分析处理。此方案简单有效,但应注意控制输出的bitmap文件数量以避免内存占用过高。
|
7天前
|
人工智能 搜索推荐 API
AI智能体研发之路-工程篇(二):Dify智能体开发平台一键部署
AI智能体研发之路-工程篇(二):Dify智能体开发平台一键部署
28 2
|
7天前
|
人工智能 API 异构计算
AI智能体研发之路-工程篇(四):大模型推理服务框架Xinference一键部署
AI智能体研发之路-工程篇(四):大模型推理服务框架Xinference一键部署
36 2
|
7天前
|
人工智能 网络协议 Docker
AI智能体研发之路-工程篇(三):大模型推理服务框架Ollama一键部署
AI智能体研发之路-工程篇(三):大模型推理服务框架Ollama一键部署
34 2
|
15天前
|
人工智能 物联网
【2022年无线通信和与物联网专场】中国工程院张平院士-AI使能6G演进与应用
中国工程院张平院士关于"AI使能6G演进与应用"的演讲摘要。
42 8
|
19天前
|
人工智能 自然语言处理 Python
🔍显微镜下的AI魔法:深入剖析生成式模型提示词工程,细节决定成败🔍
【8月更文挑战第1天】在人工智能领域,生成式模型作为连接现实与想象的桥梁展现出独特创造力。提示词工程在此扮演关键角色,通过精细调整引发内容生成的重大变化。以创意广告生成为例:初始宽泛提示词难以激发独特文案,经深度剖析与微调后,加入情感元素的提示词能更好引导模型创造共鸣内容。示例代码模拟此过程,展示优化提示词的重要性,强调细节在生成式AI中的决定性作用。
27 8
|
15天前
|
人工智能 Java API
JeecgBoot 低代码平台快速集成 Spring AI
Spring 通过 Spring AI 项目正式启用了 AI(人工智能)生成提示功能。本文将带你了解如何在 Jeecg Boot 应用中集成生成式 AI,以及 Spring AI 如何与模型互动,包含 RAG 功能。
52 3
|
19天前
|
人工智能 自然语言处理
💡脑洞大开!生成式大模型提示词工程,解锁AI创作新维度的钥匙🗝️🌟
【8月更文挑战第1天】在今日科技与创意交织的世界里,生成式大模型如GPT系列、Stable Diffusion等,宛如通往未知世界的神秘大门。提示词工程则是开启这扇大门的钥匙,引领我们步入AI创作的新维度。通过巧妙设计提示词,可以引导AI探索传统手段难以触及的领域。例如,为了创作一幅“梦境与现实交织的城市”,基础提示词可能不足以激发AI的创造力。而优化后的提示词通过增加细节描述,不仅能提供更丰富的素材,还能激发AI探索更复杂主题的能力。在这个时代,提示词工程为我们打开了AI创作的新大门,让我们能够携手AI创造超越想象的作品,共同书写创意传奇。
34 7