机器学习+运筹优化=?

简介: 本文主要从机器学习和运筹优化两个方面介绍了其在生产管理和商业运营中的应用。通过农业、养殖业和新零售的案例,深入讲解了应用场景和原理。


演讲嘉宾简介:谭剑,阿里巴巴达摩院MIT资深算法专家。


数十款阿里云产品限时折扣中,赶紧点击这里,领劵开始云上实践吧!


本次直播视频精彩回顾,戳这里! 

 

简介

本次分享主要围绕机器学习和运筹优化两个方面。它们在学术角度存在很大的重合,也有各自的侧重点。为了更好地帮助大家理解,这里借用心理学教授DANIEL KAHNEMAN的表达。


e4b4eed06f9cd340c83b21913d4194612806a8ed


人有两个系统,System1System2,分别负责快思考和慢思考。所谓快思考,即普通人在12秒之内能做出的决定,反之,如果需要一定的专注和专业,则为慢思考。在过去的六七年中,业界逐渐取得了在机器学习技术上的突破。而在很多传统行业中,关注的更多的是运筹学的内容。在复杂的生产管理和商业运营中,往往需要人在System1System2之间进行反复的迭代,以取得更优的解。下面将围绕机器学习和运筹优化分享三个具体的实例。

 

案例介绍

第一个案例是智能农业。主要涉及养殖和种植。背后涉及的知识点是深度学习模型压缩与加速。 第二个案例是计算资源优化。它是运筹学比较关注的问题。第三个案例是新零售。本文将从算法和架构的角度,提供一些新的视角。我们的最终目的是希望通过机器学习使感知模型自动化,同时通过运筹优化使决策过程智能化。

 3ac11328096fc1b2c32f03778df56c250d5f9838


智能农业

下图展示了深度学习模型压缩与加速在应用集团内外的一些落地项目。


88175c67793e29f3b2c8b6d63f0c1a2d2015dabe


下面主要介绍在种植和养殖方面的实际应用。下图展示了“天蓬计划”这个项目是真实的部署在养殖场中的。从右侧这张图展示的是实时监控猪的数量。左侧这张图是用以确定猪的身份的,比如来源、成长曲线等一系列关键的参数信息。


1ff7bd993e69779262079990270130bc62ce7866


智能农业

通过无人机技术,我们希望能准确地获取农作物的生长状态信息。为承保、理赔提供参考信息,为实时监管提供有利的帮助。

 

b9ce3f033548c42598698d1be90fe8ef5b43f441


下图展示的也是一个实时部署系统。在下图中,我们识别出了玉米大多正处在开花期。不仅如此,还识别出了数量信息。

 

6c4ae57043313fd3c8cddb4e554a63db539b0bdd


下图展示了在烟草种植行业中的应用。左边的图,准确的识别出了棵树,为政府补贴和保险提供关键的信息。右图,烟草种植面积评估,对生产规划有着很重要的参考价值。

 

38a756d88b6a87b1b60c8c8a80b27f2c89bd9bcf


相关算法

这些应用的背后都需要强大的算法支持。在云端,我们有自己的训练平台,在移动端有嵌入式系统。但应用时还是存在一些问题亟待解决。

 

9fced9bc575fc794551a0a062d132f04859bab4c


为此我们提出了Gauss作为解决方案。


fe1580325e81f47e87dc8d7152348015b01e6b5d


在服务器端,有Gauss训练平台,集合了目前业界比较先进的算法进行模型的加速。并且,在过程中,我们也在自行开发新的技术,比如模型离散技术。在部署时也进行了优化,比如智能盒子。在之前提到的养猪实例中,就有智能盒子支持的摄像头。

 

下图列出了高效前向推理中的主要技术要点。

 

ddd18c9e05c7f12d9f8e3687acb778dfe090edf8

 

下面介绍有关计算资源优化的内容。由于我们内部管理了大量的数据中心,和海量的服务器,其中有极端复杂的技术。我们的目标是通过数据和算法得到最优的策略。主要的应用有三个。第一,优化预测。即根据趋势,在物体被分配之前,有针对性的找到可能的关注点。第二,优化配置。比如容器资源分配,不能多也不能少。第三,异常检测。在智能运维中有比较重要的应用。

 

5c4c02eca2cea2f82a4bf786b99eddb4077d3e6b


下面给大家详细介绍一下资源调度的问题。它的基本模型非常简单,但在实际应用上是不可行的。主要的问题在于实际应用中异常复杂的约束关系。

 

fe3744f2b2c2759d5aec3e57639e447c0464f021


下图给出了三个真实的计算资源优化实例。每张图的左边和右边都展示了上线前和上线后的区别。

 

715f61d2d40497bb8e4812efd035e72acb6aa451


新零售

下面介绍新零售方面的应用。关键点在于。下面主要从算法架构的角度来讲述对新零售的理解。一个非常成功的案例就是盒马新零售。盒马是一个线上线下合一的自营体系。每一个店面分为两个部分。一部分是前台实体店面,另一个部分是仓储。前台主要服务的是线下的客户,仓储主要服务的是线上的客户。一个盒马店面实际上只有30%左右线下用户,有超过70%的用户是线上的。这种生态系统与传统的电商,比如淘宝,不一样。在线下的角度,它与菜鸟等,也不一样。在算法的角度,线上,不仅要关注用户的偏好,还要关注库存,也就是说线上对线下的库存起到导入的作用。在线下库存的角度,做库存和运营配送时也要考虑线上的作用。线上线下实际上是一个有机的整体,它跟菜鸟、淘宝这样的重量级系统是不太一样的。同时,这也造成了一系列的算法挑战。

 

 0b6ed4b3da218af99216b10dec1ba56cdcf5d820

 

第一,线上部分,用户行为偏好问题。我们可以从三个层次来理解这个问题。一,线下活跃但线上沉睡的客户。第二,新用户。第三,活跃用户个性化。

 

e79d726c7b20cc12879888ed1227f2681c5f8b74


第二个问题是,线上精准营销的匹配问题,如下图。

 

10d641164673d4e9b87eea91c5131fae4543236e


第三,是线下配送问题。线上会源源不断的产生订单。订单都会有各自的配送时间和地点。这个问题的解决方案就是合批集单。

 

394a4f525794968181004ca5461779b7909b4d49


关于线下集单优化问题,如下图。

 

0fc5ebaefb1391fcce9883e0a1f27994ab1d7d22


最后,从算法角度介绍一下新零售。除了之前提到的线上线下。还有一个问题就是运营。运营可以实时地获取新闻、交通、天气,并输入到线上和线下以起到调控的作用。

 

283ef21e6a1dfd954b97160dc8b272f5d4fb8800


最后回归到人,技术最终是为了服务于人。希望能通过机器学习和运筹优化在更多行业起到助力的作用。


0f23202aff6e6458f4e6bc4a0bff452b11b2e55f

本文由云栖志愿小组马JY整理

相关文章
|
13天前
|
机器学习/深度学习 数据采集 数据挖掘
实战派教学:掌握Scikit-learn,轻松实现数据分析与机器学习模型优化!
【10月更文挑战第4天】Scikit-learn凭借高效、易用及全面性成为数据科学领域的首选工具,简化了数据预处理、模型训练与评估流程,并提供丰富算法库。本文通过实战教学,详细介绍Scikit-learn的基础入门、数据预处理、模型选择与训练、评估及调优等关键步骤,助你快速掌握并优化数据分析与机器学习模型。从环境搭建到参数调优,每一步都配有示例代码,便于理解和实践。
64 2
|
2月前
|
机器学习/深度学习 并行计算 PyTorch
优化技巧与策略:提高 PyTorch 模型训练效率
【8月更文第29天】在深度学习领域中,PyTorch 是一个非常流行的框架,被广泛应用于各种机器学习任务中。然而,随着模型复杂度的增加以及数据集规模的增长,如何有效地训练这些模型成为了一个重要的问题。本文将介绍一系列优化技巧和策略,帮助提高 PyTorch 模型训练的效率。
192 0
|
8天前
|
机器学习/深度学习 数据采集 数据挖掘
特征工程在营销组合建模中的应用:基于因果推断的机器学习方法优化渠道效应估计
因果推断方法为特征工程提供了一个更深层次的框架,使我们能够区分真正的因果关系和简单的统计相关性。这种方法在需要理解干预效果的领域尤为重要,如经济学、医学和市场营销。
23 1
特征工程在营销组合建模中的应用:基于因果推断的机器学习方法优化渠道效应估计
|
2月前
|
机器学习/深度学习 存储 人工智能
提升深度学习性能的利器—全面解析PAI-TorchAcc的优化技术与应用场景
在当今深度学习的快速发展中,模型训练和推理的效率变得尤为重要。为了应对计算需求不断增长的挑战,AI加速引擎应运而生。其中,PAI-TorchAcc作为一个新兴的加速引擎,旨在提升PyTorch框架下的计算性能。本文将详细介绍PAI-TorchAcc的基本概念、主要特性,并通过代码实例展示其性能优势。
18143 166
|
16天前
|
机器学习/深度学习 算法 决策智能
【机器学习】揭秘深度学习优化算法:加速训练与提升性能
【机器学习】揭秘深度学习优化算法:加速训练与提升性能
|
1月前
|
机器学习/深度学习 安全 网络安全
利用机器学习优化网络安全威胁检测
【9月更文挑战第20天】在数字时代,网络安全成为企业和个人面临的重大挑战。传统的安全措施往往无法有效应对日益复杂的网络攻击手段。本文将探讨如何通过机器学习技术来提升威胁检测的效率和准确性,旨在为读者提供一种创新的视角,以理解和实施机器学习在网络安全中的应用,从而更好地保护数据和系统免受侵害。
|
17天前
|
机器学习/深度学习 算法
【机器学习】逻辑回归介绍(逻辑回归应用场景,原理,损失及优化详解!!!)
【机器学习】逻辑回归介绍(逻辑回归应用场景,原理,损失及优化详解!!!)
|
1月前
|
机器学习/深度学习 数据采集 存储
一文读懂蒙特卡洛算法:从概率模拟到机器学习模型优化的全方位解析
蒙特卡洛方法起源于1945年科学家斯坦尼斯劳·乌拉姆对纸牌游戏中概率问题的思考,与约翰·冯·诺依曼共同奠定了该方法的理论基础。该方法通过模拟大量随机场景来近似复杂问题的解,因命名灵感源自蒙特卡洛赌场。如今,蒙特卡洛方法广泛应用于机器学习领域,尤其在超参数调优、贝叶斯滤波等方面表现出色。通过随机采样超参数空间,蒙特卡洛方法能够高效地找到优质组合,适用于处理高维度、非线性问题。本文通过实例展示了蒙特卡洛方法在估算圆周率π和优化机器学习模型中的应用,并对比了其与网格搜索方法的性能。
233 1
|
2月前
|
机器学习/深度学习 存储 算法
利用机器学习优化数据中心的能源效率
【8月更文挑战第30天】 在信息技术不断进步的今天,数据中心作为支撑云计算、大数据分析和人工智能等技术的核心基础设施,其能源效率已成为衡量运营成本和环境可持续性的关键指标。本文旨在探讨如何通过机器学习技术对数据中心进行能源效率优化。首先,文中介绍了数据中心能耗的主要组成部分及其影响因素。其次,详细阐述了机器学习模型在预测和管理数据中心能源消耗方面的应用,并通过案例分析展示了机器学习算法在实际环境中的效果。最后,文章讨论了机器学习优化策略实施的潜在挑战与未来发展方向。
|
2月前
|
机器学习/深度学习 存储 前端开发
实战揭秘:如何借助TensorFlow.js的强大力量,轻松将高效能的机器学习模型无缝集成到Web浏览器中,从而打造智能化的前端应用并优化用户体验
【8月更文挑战第31天】将机器学习模型集成到Web应用中,可让用户在浏览器内体验智能化功能。TensorFlow.js作为在客户端浏览器中运行的库,提供了强大支持。本文通过问答形式详细介绍如何使用TensorFlow.js将机器学习模型带入Web浏览器,并通过具体示例代码展示最佳实践。首先,需在HTML文件中引入TensorFlow.js库;接着,可通过加载预训练模型如MobileNet实现图像分类;然后,编写代码处理图像识别并显示结果;此外,还介绍了如何训练自定义模型及优化模型性能的方法,包括模型量化、剪枝和压缩等。
42 1