被互联网从业者称为“朝圣大会”的云栖大会,于2018年9月19日至22日在美丽的杭州云栖小镇举办。今年会议的主题是“驱动数字中国”,来自全球6个大洲81个国家及地区共12万人次现场参加。
9月19日,杭州气温高达32度。与杭州热度一样高的,还有在云栖大会当天机器学习专场。机器学习专场以“为AI的旅程加速”,由阿里巴巴机器学习PAI平台5位技术专家以及2位行业专家,为与会者分享了机器学习最前沿的技术,助力AI应用发展与落地。 整个场次座与虚席,门外还挤了很多热情的观众。在现场工作人员的协调下,又开了一个分会场,通过直播的方式满足众多机器学习爱好者的需求。
机器学习平台PAI (Platformof Artificial Intelligence)是阿里巴巴集团的机器学习算法平台,该平台为用户提供了一站式数据处理、算法模型训练、离线在线预测的服务。该平台不仅服务阿里巴巴集团内部,同旳也已商业化对外提供服务。在本次云栖大会上,PAI的专家团队向与会者介绍了在深度学习、在线预测、流式算法、增强学习等领域的技术创新。
图为阿里巴巴高级算法专家孙敏敏
在开场,阿里巴巴高级算法专家孙敏敏以《深度学习深度优化》为主题为大家介绍了PAI在深度学习方面的优化技术。在深度学习优化方面,孙敏敏结合模型与系统联合视角,介绍深度学习模型在具体场景应用时的性能调优的经验与方法。他介绍在调优方面忽略底层系统特点的模型调优或忽略上层模型特点的底层调优,都会出现局部视角的瓶颈,影响到训练及在线布署的效率,复杂系统leaky abstraction的性质决定了没有性能银弹。只有结合底层系统特点进行上层模型层面的调优,可以更充分发挥系统计算性能。比如照顾到硬件特性的模型压缩工作以及训练优化工作。同时结合上层模型特点进行底层系统层面的调优,可以获得更广阔的系统优化空间,比如照顾到模型特点的计算图优化和深度学习编译优化。
图为阿里巴巴资深算法专家杨旭
在流式算法处理方面,PAI 基于 Flink/Blink 提供了流式算法平台。阿里巴巴资源算法专家杨旭以《Alink:流式算法平台》为主题介绍了流式算法平台Alink的架构与功能。Alink 是 PAI 算法平台的一部分,是基于 Flink/Blink 的流式算法平台。该平台希望通过提供丰富的算法库及便捷的编辑运行环境,帮助数据分析和应用开发人员快速高效的实现各种流式数据的分析和处理。Alink算法平台上有丰富的数据分析算法,具体包含常用统计分析、机器学习、文本处理、推荐、异常检测等多个领域的算法;Alink平台封装了多种常用的数据源,包括MaxCompute表、Datahub流式数据、CSV数据、随机生成数据等数据源,这使得数据处理及分析链路更加通畅;Alink平台支持流式数据的可视化,能够实时的显示流式数据的分析结果;Alink平台提供了多种在线学习算法,及常用的迁移学习算法。Alink平台上,数据分析和应用开发人员能够从数据探索、模型训练、实时预测、可视化展示,端到端地完成整个流程。
图为阿里巴巴高级算法专家李文鹏
在线预测是模型主要应用,PAI 集成了在线预测服务。阿里巴巴高级算法专家李文鹏以《PAI在线服务框架》为主题向大家介绍了PAI上的在线预测服务架构与特点。PAI 在线预测服务充分利用了集群的弹性扩缩、负载均衡等分布式技术,达到了非常高吞吐,在高并发的在线预测提供技术支撑。PAI在线预测服务基于ECS/EGS构建,使得该服务可以灵活地在不同的region提供服务,从而大大提升资源利用率,降低成本。目前PAI在线服务已在上海,北京,新加坡和美国提供服务。
图为阿里巴巴高级算法专家黄俊
增强学习也是PAI 团队的主要研发方向。阿里巴巴高级算法专家黄俊以《A3gent:增强学习框架》为主题,为大家分享了PAI上的强化学习平台。PAI 的强化学习平台A3gent是基于Tensorflow开发的面向工业级应用的深度增强学习平台;针对增强学习特有的功能做了抽象化(模块化)设计,包括replay buffer、exploration、action distribution等;根据不同算法类型(on/off policy)设计了不同的交互模式,支持离线、在线数据源;整合了目前最流行的分布式强化学习架构,如GA3C,IMPALA,Ape-x等,在不同场景下可选择不同的分布式架构以获得最佳性能;封装了目前state-of-the-art的强化学习算法组件,用户可通过简单拖拽组件并配置参数的方式使用这些算法;目前A3gent已经在集团内部多个核心业务成功上线。
图为阿里巴巴高级算法专家杨强鹏
自然场景文字检测对于许多计算机视觉领域的应用都有很大的帮助,例如在图像信息检索、自动翻译、自动驾驶等领域都需要用到文字检测技术。为了更好的解决这个问题,PAI团队提出了IncepText算法,该算法能有效的解决文字大小,角度变化较大的问题。该算法在ICDAR 2015 Incidental Scene Text检测任务中以90.47%的Hmean排名世界第一。同时IncepText论文也被IJCAI 2018接收。来自于PAI团队的高级算法专家杨强鹏为大家揭密了《IncepText 文字检测算法》及OCR文字识别产品。OCR文字识别产品是PAI上提供的上层应用,该服务提供了身份证、驾驶证、银行卡等证件类识别的API。
在机器学习专场的论坛上,来自于厦门美柚的算法专家也介绍了基于PAI的OCR预估算法优化,来自浪潮的人工智能架构师也介绍了AI计算效率的优化方法及实践案例分析。
更多精彩内容,欢迎扫描关注上方二维码查询