【2018杭州云栖】机器学习专场:为AI的旅程加速

简介: 被互联网从业者称为“朝圣大会”的云栖大会,于2018年9月19日至22日在美丽的杭州云栖小镇举办。今年会议的主题是“驱动数字中国”,来自全球6个大洲81个国家及地区共12万人次现场参加。

被互联网从业者称为“朝圣大会”的云栖大会,于2018年9月19日至22日在美丽的杭州云栖小镇举办。今年会议的主题是“驱动数字中国”,来自全球6个大洲81个国家及地区共12万人次现场参加。

9月19日,杭州气温高达32度。与杭州热度一样高的,还有在云栖大会当天机器学习专场。机器学习专场以“为AI的旅程加速”,由阿里巴巴机器学习PAI平台5位技术专家以及2位行业专家,为与会者分享了机器学习最前沿的技术,助力AI应用发展与落地。 整个场次座与虚席,门外还挤了很多热情的观众。在现场工作人员的协调下,又开了一个分会场,通过直播的方式满足众多机器学习爱好者的需求。

image.png

机器学习平台PAI (Platformof Artificial Intelligence)是阿里巴巴集团的机器学习算法平台,该平台为用户提供了一站式数据处理、算法模型训练、离线在线预测的服务。该平台不仅服务阿里巴巴集团内部,同旳也已商业化对外提供服务。在本次云栖大会上,PAI的专家团队向与会者介绍了在深度学习、在线预测、流式算法、增强学习等领域的技术创新。

image.png

图为阿里巴巴高级算法专家孙敏敏

在开场,阿里巴巴高级算法专家孙敏敏以《深度学习深度优化》为主题为大家介绍了PAI在深度学习方面的优化技术。在深度学习优化方面,孙敏敏结合模型与系统联合视角,介绍深度学习模型在具体场景应用时的性能调优的经验与方法。他介绍在调优方面忽略底层系统特点的模型调优或忽略上层模型特点的底层调优,都会出现局部视角的瓶颈,影响到训练及在线布署的效率,复杂系统leaky abstraction的性质决定了没有性能银弹。只有结合底层系统特点进行上层模型层面的调优,可以更充分发挥系统计算性能。比如照顾到硬件特性的模型压缩工作以及训练优化工作。同时结合上层模型特点进行底层系统层面的调优,可以获得更广阔的系统优化空间,比如照顾到模型特点的计算图优化和深度学习编译优化。

image.png

图为阿里巴巴资深算法专家杨旭

在流式算法处理方面,PAI 基于 Flink/Blink 提供了流式算法平台。阿里巴巴资源算法专家杨旭以《Alink:流式算法平台》为主题介绍了流式算法平台Alink的架构与功能。Alink 是 PAI 算法平台的一部分,是基于 Flink/Blink 的流式算法平台。该平台希望通过提供丰富的算法库及便捷的编辑运行环境,帮助数据分析和应用开发人员快速高效的实现各种流式数据的分析和处理。Alink算法平台上有丰富的数据分析算法,具体包含常用统计分析、机器学习、文本处理、推荐、异常检测等多个领域的算法;Alink平台封装了多种常用的数据源,包括MaxCompute表、Datahub流式数据、CSV数据、随机生成数据等数据源,这使得数据处理及分析链路更加通畅;Alink平台支持流式数据的可视化,能够实时的显示流式数据的分析结果;Alink平台提供了多种在线学习算法,及常用的迁移学习算法。Alink平台上,数据分析和应用开发人员能够从数据探索、模型训练、实时预测、可视化展示,端到端地完成整个流程。

image.png

图为阿里巴巴高级算法专家李文鹏

在线预测是模型主要应用,PAI 集成了在线预测服务。阿里巴巴高级算法专家李文鹏以《PAI在线服务框架》为主题向大家介绍了PAI上的在线预测服务架构与特点。PAI 在线预测服务充分利用了集群的弹性扩缩、负载均衡等分布式技术,达到了非常高吞吐,在高并发的在线预测提供技术支撑。PAI在线预测服务基于ECS/EGS构建,使得该服务可以灵活地在不同的region提供服务,从而大大提升资源利用率,降低成本。目前PAI在线服务已在上海,北京,新加坡和美国提供服务。

image.png

图为阿里巴巴高级算法专家黄俊

增强学习也是PAI 团队的主要研发方向。阿里巴巴高级算法专家黄俊以《A3gent:增强学习框架》为主题,为大家分享了PAI上的强化学习平台。PAI 的强化学习平台A3gent是基于Tensorflow开发的面向工业级应用的深度增强学习平台;针对增强学习特有的功能做了抽象化(模块化)设计,包括replay buffer、exploration、action distribution等;根据不同算法类型(on/off policy)设计了不同的交互模式,支持离线、在线数据源;整合了目前最流行的分布式强化学习架构,如GA3C,IMPALA,Ape-x等,在不同场景下可选择不同的分布式架构以获得最佳性能;封装了目前state-of-the-art的强化学习算法组件,用户可通过简单拖拽组件并配置参数的方式使用这些算法;目前A3gent已经在集团内部多个核心业务成功上线。

image.png

图为阿里巴巴高级算法专家杨强鹏

自然场景文字检测对于许多计算机视觉领域的应用都有很大的帮助,例如在图像信息检索、自动翻译、自动驾驶等领域都需要用到文字检测技术。为了更好的解决这个问题,PAI团队提出了IncepText算法,该算法能有效的解决文字大小,角度变化较大的问题。该算法在ICDAR 2015 Incidental Scene Text检测任务中以90.47%的Hmean排名世界第一。同时IncepText论文也被IJCAI 2018接收。来自于PAI团队的高级算法专家杨强鹏为大家揭密了《IncepText 文字检测算法》及OCR文字识别产品。OCR文字识别产品是PAI上提供的上层应用,该服务提供了身份证、驾驶证、银行卡等证件类识别的API。

在机器学习专场的论坛上,来自于厦门美柚的算法专家也介绍了基于PAI的OCR预估算法优化,来自浪潮的人工智能架构师也介绍了AI计算效率的优化方法及实践案例分析。

更多精彩内容,欢迎扫描关注上方二维码查询

相关实践学习
使用PAI+LLaMA Factory微调Qwen2-VL模型,搭建文旅领域知识问答机器人
使用PAI和LLaMA Factory框架,基于全参方法微调 Qwen2-VL模型,使其能够进行文旅领域知识问答,同时通过人工测试验证了微调的效果。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
相关文章
|
8月前
|
人工智能 自然语言处理 算法
【2025云栖大会】AI 搜索智能探索:揭秘如何让搜索“有大脑”
2025云栖大会上,阿里云高级技术专家徐光伟在云栖大会揭秘 Agentic Search 技术,涵盖低维向量模型、多模态检索、NL2SQL及DeepSearch/Research智能体系统。未来,“AI搜索已从‘信息匹配’迈向‘智能决策’,阿里云将持续通过技术创新与产品化能力,为企业构建下一代智能信息获取系统。”
950 9
|
8月前
|
人工智能 新制造 云栖大会
TsingtaoAI亮相云栖大会,AI大模型赋能传统制造业焕新升级
2025年9月24日,杭州云栖小镇,2025云栖大会盛大开幕。作为全球AI技术与产业融合的重要平台,本届大会以“AI驱动产业变革”为主题,集中展示大模型技术在各领域的创新应用。 其中,由西湖区商务局牵头组织的“AI大模型应用与产业融合”专场论坛成为大会亮点之一,吸引了来自政府、企业及投资机构的百余名代表参与。 在论坛上,TsingtaoAI作为制造业智能化转型的代表企业,分享了在具身智能-制造企业的AI应用实践。
590 1
|
8月前
|
人工智能 运维 Cloud Native
2025 云栖精选资料:《从云原生到 AI 原生核心技术与最佳实践》PPT 免费下载
一本合集,四大主题,覆盖 AI 原生技术的核心版图。立即获取,与行业领跑者同行,抢占 AI 原生时代的技术先机!
|
9月前
|
人工智能 云栖大会 调度
「2025云栖大会」“简单易用的智能云网络,加速客户AI创新”专场分论坛诚邀莅临
”简单易用的智能云网络,加速客户AI创新“专场分论坛将于9月24日13:30-17:00在云栖小镇D1-5号馆举办,本场技术分论坛将发布多项云网络创新成果,深度揭秘支撑AI时代的超低时延、自适应调度与跨域协同核心技术。同时来自领先企业的技术先锋将首次公开其在模型训练、企业出海等高复杂场景中的突破性实践,展现如何通过下一代云网络实现算力效率跃升与成本重构,定义AI时代网络新范式。
289 4
|
9月前
|
人工智能 云栖大会
|
9月前
|
消息中间件 人工智能 开发框架
火速收藏!2025 云栖大会 AI 中间件议程看点全公开(附免费报名通道)
2025 云栖大会“云智一体 · 碳硅共生”的主题下,9月26日,云栖小镇D1-3馆「AI 中间件论坛」将聚焦 AI 时代中间件的技术演进与创新实践,带来 AI 开发框架、消息队列、事件驱动架构及 API 网关等关键技术在 AI 领域的前沿技术探索、最新产品发布、落地实践经验。
488 52

热门文章

最新文章