CBM 是指 C2B2M 的商业模式, C是消费者,M是制造商(生产者),通过平台直接连接生产者和消费者,形成消费者需求驱动生产供给的这样一种模式。过去一年多,淘宝在CBM这种模式上进行了深入的探索和实践。 如何应用CBM的模式,结合大数据的能力,塑造一个新的品牌运营体系。本文根据淘宝高级技术专家干城在云栖大会新零售技术峰会上发表的《CBM赋能“数造”新品牌》的演讲整理而成。
今天的分享内容主要分三块,首先介绍下我们对CBM的思考,然后再介绍CBM模式下如何构建企业信息数字化架构,以及如何应用数据驱动商业智能化的一些探索。
一、CBM模式介绍
先来看一组数据。这组数据是日本七八十年代人均GDP增长趋势和国内近十年增长趋势的一个对比,我们现在的商业环境和日本当时的商业环境比较像,据调研,不管是在人口结构还是消费增长上,还有居民消费特征上都比较像,通过和日本的比对来看我们未来的商业趋势。日本早已进入了第四消费时代,国内尤其在一二线城市消费特征已经呈现出从第三消费时代向第四消费时代演进的趋势。今天的很多零售品牌企业像 MUJI,优衣库都获得很大成功, 也是得益于社会消费升级的大背景,消费理念的变化。这些都值得我们去思考,我们的商家如何应对未来新的消费趋势,我们的商业模式会如何去演进。
图1-1 C2B-C2M-C2B2M
过去几年, 在电商领域已经在探索新的商业模式。原来那种M2B中间经历很多B端再到消费者端的商业模式存在明显的弊端,链路长, 中间环节多导致的高溢价,生产者和消费者的阻隔导致生产端无法快速响应市场等等,正是这些推动这新的商业模式的探索,从C2B到C2M,再到今天讨论的C2B2M。C2B 可以为消费者提供好的个性品牌体验, C2M更多强调性价比,我们今天不管是B还是M,对平台都是非常重要的合作伙伴,我们今天探讨的C2B2M就是通过我们平台让商家直连消费者和生产者, 消除中间环节, 提供更有竞争力的商品, 并推动形成新的制造模式。
图1-2 从中国质造到淘宝心选
那么在这种模式下,我们平台需要提供什么样的能力?通过过去一年多的探索,我们“数造”了淘宝心选这个自有品牌,实现了从原中国质造平台到淘宝心选模式的转型升级,从质造到今天结合大数据能力向智能制造的一些尝试。在这背后还是平台思维, 去发现和解决原有平台商家的痛点。在原有的中国质造这个平台上, 连接了很多的优质生产者制造商, 实现消费者跟工厂直连。但这种平台模式下留给了商家不少痛点, 生产者需要具备很好的供应链能力, 前台运营服务能力, 消费者需求洞察能力等等,这些都是留给商家的痛点,也是我们平台去做模式升级的初衷。当然,今天去探索CBM模式的契机也是基于整个商业环境的变化。今天消费升级的趋势如何去影响产业的变化,今天新技术带来的消费者体验的变革如何应用到商业,以及在阿里生态内,新零售引领下以人为本的理念如何践行,淘系内技术驱动的智能化转型如何实施,这些都是我们今天要探讨的命题。前面这些就是我们对这个模式背后的一些思考,下面分享一下在这个模式下,我们去做一些怎样的实践。
结合过去的经验, CBM的实施我们总结了两大核心策略:商品线和用户环。一是以商品为核心的一体化商品研发和管理的运营机制, 另外一个是以用户为核心驱动结合数据能力的智能化运营机制。
一体化商品驱动是指我们围绕商品研发全生命周期,从需求到设计到开发到最后的物流仓储零售一体化管控,把这个全生命周期分成很多不同的环节,每个环节背后对应一系列的动作,事件和数据,把所有这些环节实现全面的标准化和数字化并在线可视化管理。这样不管在内部各部门,还是跟外部协作之间,都能够通过系统能力支撑,很好协同起来,形成一个高效的快反链路。
在用户智能驱动这一块,我们是以消费者需求去驱动,结合大数据能力,去优化全链路运营体系, 让业务运营更有确定性和精准性。比如我们今天在做库存控制,是通过需求预测,通过对用户消费大数据的挖掘,进行销量预测,再给到确定性的生产计划;我们做商品企划的选品过程,是依托于我们对用户的洞察,通过挖掘平台海量的UGC数据,聚合出消费者的一致性诉求 - 用户最关心什么、最喜欢什么,成为我们选品重要的依据。我们对商品生命周期的定义,也是依托于我们对用户前台行为的分析,商品该提升曝光,该增加流量,还是该清库存,该下线,都是通过消费数据来分析指导,消费者喜不喜欢, 买不买账, 直接影响商品的经营策略。新品上市,则依托于跟消费者的互动测款,预判新品的市场需求, 来指导新品上市。当然从用户数据中,我们能发现更多的价值,比如说我们今天新品的上市时机、切入这个市场的成本有多高,都是能够借助于数据洞察的。通过对用户数据的挖掘,我们去优化我们全链路的运作体系,从C2B到再到B2M再到B2C三大板块。
图1-3 用户及智能驱动
当然,今天我们还处在对CBM的探索期,未来CBM模式的愿景是去构建新的品牌运营体系这个平台,再去开放赋能: 从底层的文化组织机制的建设, 到提升企业运营效益的方法论, 再到整套模式和标准的输出,以及到最顶层借助新技术, 大数据去赋能业务创新。这是CBM模式下我们要去构建的新品牌运营支撑体系这样一个平台的构想。
图1-4 数据化思维构建新的品牌运营体系
从技术角度看,我们技术的愿景是希望用数据化思维去建立这套体系。这背后有两大核心,一是我们如何构建它的全面数字化体系,二是如何运用数据驱动商业的智能化运作,真正做到智能商业的演进。这是我们今天要探索的两个主题。
二、CBM数字化架构
在数字化层面,我们主要从三个维度来思考:
在企业层面,我们要以数字化思维构建企业的信息架构,支撑从商品策划、制造到零售垂直整合一体化这种SPA经营模式,赋能到商家进行全链路的经营管控和垂直整合能力。
在行业级,我们希望构建各个行业&品类的SOP流程标准、接入标准等等,构建高效的网络协同机制。
在平台层面,我们需要以平台思维去构建这套数字化体系, 去构建S2b的平台, 未来把我们沉淀的全供应链服务能力开放出去,把我们积累的企业级和行业级服务能力开放出去。
谈到企业层面的数字化,就是要把企业的整个运作体系背后的”人”、”事”、”物”做好全面的数字化,在CBM模式下, “人”对应的核心是的消费者和生产者, 品牌商, “事”对应的核心是企业的整个运作流程,从企划、设计、开发、生产、流通到销售整个的商品全生命周期的运作过程,“物”则是企业运作过程的一切实物虚物, 我们把企业运作过程抽象出来的核心实体(概念产品, 原型产品, 样品,实物产品, 货品, 商品)作为我们的“物”去设计,以这样的“人”“事”“物”去构建整个数字化架构。
图2-1 CBM数字化核心
通过前面的数字化分解,我们已经抽象出“人”“事”“物”背后的所有核心实体。基于这些核心实体,我们去构建每个业务域,每个域都是单独的容器,每个容器之间的线代表的是容器之间的互联互通。再对每个域进行深入拆解,我们去定义每个域的核心数据,比如说企划域(对应的实体是概念产品)要定义产品的核心策略、产品定价、市场定位、产品卖点、产品的目标人群等等,在样品域(对应的实体是样品)要定义包装、工艺、设计等等,在产品域(对应的实体是实物产品)我们的核心数据是人、机、料、法、环,深入到生产环节,在质量域核心是做质量控制和标准建设,建立对商家,工厂和货品的质量标准。这样就形成我们完整的数字化框架。
前面讲的是我们对人、物的数字化,再看事的数字化, 这背后对应的是要探索CBM的标准化(SOP),基于每个行业、每个品类构建不同的操作标准,形成一个能够更高效、更灵活的供应链响应链路。这背后技术的核心,是需要一个具备灵活流程编排能力的流程引擎。我们是基于现有的开源流程引擎做扩展,在BPMN2.0规范基础上做扩展,扩展出一些虚节点和并发子流程节点, 支撑更复杂的流程编排。
图2-2 CBM数字化架构
通过前面的分析,数字化的拆解,形成了这样的一套三层技术架构。最上面一层是业务前台,中间比较厚的一层是根据前面数字化拆解来设计的业务中台,底层是我们要后面要介绍的大数据平台。
在架构这套体系背后的核心思考总结起来有几个要点:
● 以数据化思维构建数字化体系,每个域的核心都是面向数据的设计;推动一体化的数据建设,避免信息孤岛● 应用了分层和服务化的架构,形成松耦合,易扩展的灵活架构,各个域之间通过中间件(RPC,消息中间件等)实时同步
● 要实现人事物的全面数字化,去实现一切实物虚物的数字化,包括我们今天在做生产端的IoT方案、门店IoT方案,都是在加强数字化深度, 逐步演进到全面的数据化决策。
图2-3 CBM数字化产品功能演示
看一下现有的产品demo,图上显示协同中心的全流程管理功能。
三、CBM智能化探索
在数据驱动方面,CBM大数据赋能最核心的要点是智能选品和智慧生产:在商品企划阶段,要借助大数据辅助业务做智能选品,在生产阶段我们要对市场进行预测,给到确定性的生产计划。
我们先从选品过程开始。选品过程核心就是定义目标人群,然后挖掘目标人群背后的核心诉求是什么,主要方法是对人的全方位行为路径进行分析,这个群体在什么时间、什么地点做了什么事情, 从哪儿来到哪儿去、交互的动作、交互的内容等等。在互联网平台上行为路径的核心节点是搜索、浏览、问答、下单、评价,交互的内容只是商品的各种形式。通过这个行为路径分析,我们去挖掘消费者的核心诉求,首先从交易关系分析这个群体的直接诉求,再进行全方位的洞察,看用户的潜在诉求。洞察到用户的需求后,再结合大数据能力做市场决策。
在市场决策环节,首先要做市场判断,这个市场是否值得切入。是否切入市场的核心取决于两大要素,一是需求本身,二是成本高低。需求本身看需求的规模和成长性,用户的行为数据都是可以量化成规模和成长性两个纬度,既看过去也看未来,过去基于数据统计,未来基于数据预测。另外一个重要的因素是成本因素,进入这个市场的成本越高,就越不建议切入。基于用户消费大数据我们构建了市场集中度模型,用于判断进入这个市场的成本,如果市场已经高度集中在头部商家,那么不建议进入这个市场。我们还要扩展数据能力,包括产品生产成本、物流成本,未来也希望覆盖这些数据。在市场策略环节, 需要去分析怎么切入这个市场, 我们构建了价格分布模型,辅助商品上市怎么做定价。我们构建了季节性算法模型,借助于大数据去判断最合理的上市时机。
这些就是目前我们对大数据应用到选品的一个核心思路, 是根据人在实际的选品操作中不断去学习总结提炼出来的关键决策路径,并在每个决策点上尝试让机器去做一些辅助决策
当然, 在实际的业务操作当中,人的选品思路比这个要复杂很多,我们需要把人背后个性化的决策路径变成统一的决策路径,让机器去模拟人的决策路径, 形成数据化决策, 未来再逐步演进到机器自动化决策。
我们进一步来看现在如何用我们的系统能力模拟人的商品企划的过程。我们的核心构想是去设计一个电子买手, 能够把资深买手的经验能力能够沉淀和复制 - 通过机器去赋能普通买手能够具备专业的选品能力。
下面是买手做商品企划跟我们CBM大数据系统能力的一个对比。 买手会先首先做行业现状分析找出潜力和规模市场, 我们系统根据算法直接给出市场建议;再者买手会进行用户调研找到消费者的核心诉求等, 我们系统通过挖掘消费者的UGC数据直接聚出消费者的核心诉求, 痛点等; 然后买手会研究市面上细分市场和产品的现状, 我们系统通过关联挖掘用户和细分产品的关系, 分析商品的特征, 找出消费者的偏好,定义出商品画像 –关键属性, 商品结构, 建议价格段,上市时间等; 最后买手会根据经验预估市场需求,我们系统则投放用户测款预判消费者需求热度来做上市建议。而这其中的每个环节都是对前面选品思路的一个迭代。通过CBM系统的能力, 没有行业经验的买手也能够借助于系统来提升自己选品的能力。
我们来看一个具体的例子。我们首先定义好目标人群和场景,然后交给系统执行。系统通过数据判断,目前在箱包行业里开发拉杆箱最有优势,这个细分市场具备规模大, 成长性不错,市场集中度较低,进入成本较低等等优势特征,建议我们切入这个市场。系统再通过对消费者需求的洞察,依托对海量UGC数据的挖掘,判断目前消费者核心的诉求点在重量、质量等要素。第三阶段, 深度挖掘人货匹配关系,做深度的商品洞察, 挖掘消费者的主流偏好,定义出高潜力的商品画像,包括今天商品的主流关键属性是什么、主流价格是多少、最佳上市时机是什么时候。最后,通过跟消费者的互动测款,判断每个SKU的潜在热度,给出确定性的需求容量。
图3-1 从可视化到智能化
前面是我们对机器智能的一些探索,把原先BI可视化的这些分析思路转换成机器决策的思路, 在人的选品决策路径找出尽可能多的点用机器去辅助决策。譬如刚才提到的市场集中度, 采用随机森林算法去做强弱二分类。上市时机首先借助于GBDT去判断是否有明显的季节性,销量预测方面则借助于Xgboost去预测市场需求,消费者洞察则是借助于NLP技术去挖掘消费者UGC聚合出消费者的核心诉求,用户偏好等。当然,我们今天所有这些能够做智能化探索,都是得益于有大数据和算法的能力。对于算法的应用,需要技术人员具备数据化思维, 去分析业务的决策路径,定义问题和目标,选择合适的算法去建模和训练, 结果验证,反馈再优化的持续过程。当然, 算法并不能解决今天所有的问题,我们在探索过程当中也是发现了不少的痛点,比如说今天我们平台有海量的数据,但是并不全面,我们的数据还缺乏宏观政策, 外部市场环境,工业数据(譬如工艺, 产能等), 行业知识(尤其是生产领域的知识)等等。在电商平台上,前台的表达都是偏消费者的语言,但是切入到制造端,发现很多是工业的语言、生产的知识,这些导致了机器无法根据消费者需求直接定义出商品的结构设计, 而需要专业的人员进行转换设计。另外是人的语言非常复杂,我们用NLP技术挖掘背后海量的UGC数据,一个难点是需要大量的人工植入和标注工作,这样才能让机器理解海量UGC文本的语义。当然今天还有很多难点导致算法在实际商业中的应用受阻,包括算法的不可解释性, 人的创意直觉的不可替代性等等。 这背后重要的一点是人在执行过程能否坚持用数据化思维推动你们整个业务的运作,做到真正的数据驱动。
图3-2 大数据平台技术选型
前面提到的数据智能离不开这背后我们自建的大数据平台,今天的大数据平台一定是一个综合性工程,涵盖从数据采集到存储、处理、分析、再到最后的应用全过程,不是单一的产品技术能够解决的。今天的大数据处理技术非常多,层出不穷,Hadoop, Spark, Flink, HBase, Flume, Kafka,Impala,Phoenix…等等, 对我们来说也是一个挑战,如何快速去构建一个大数据平台, 快速选型、快速架构? 首先在存储层面,今天的存储一定是多样化的,KV用NoSQL, 文件用对象存储, 海量的结构化数据采用分布式存储等等,而在存储的技术选型上,不仅考虑存取性能, 数据的一体化 - 数据之间的同步、转换、运维成本也是重要的考虑因素。在应对海量离线计算的选型上,我们今天面对的数据都是PB级以上,分布式并行计算框架MapReduce已经是这块的主流方案, 在国内自建Hadoop或者使用阿里云的MaxCompute, 两者都能够实现大规模且相对低成本的计算能力. 当然, MaxCompute本身就是在云上, 运维成本上有明显优势, 也有更完善的数据导入和跟其他异构数据源的同步方案, 目前是我们内部的主流离线分析方案。在实时分析计算的OLAP选型上,我们选择基于MPP架构的多种产品进行了研究, 譬如目前aliyun上的基于GreenPlum的HybridDB 以及HybridDB for mysql(分布式HTAP数据库)两个产品在实测中都表现出不错的性能, 尤其HybridDB for mysql 在百亿级别的数据实时join十亿级别的数据, 聚合、排序、去重等操作均能稳定在单次4s以内。大数据处理技术大大提升了我们挖掘海量数据的能力, 但实施成本会是个重要考虑因素,并不是说所有这些都交给工具,人还是要做很多的工程优化,需要工程师对大数据的处理进行大量的预处理、优化,降低实施成本,譬如说我们在实时分析过程会面临高维的问题, 那么进行适当的降维是优化的一个重要手段. 在应对复杂检索以及查询QPS较高的场景, 目前已经上云的OpenSearch,ElasticSearch都是我们较好的选择, 稳定性和运维成本都更有优势. Open Search是基于我们内部的HA3搜索引擎, 在官方的测试对比中,HA3比Elasticsearch具备更高的QPS, 更低的查询延迟. OpenSearch支持两阶段排序定制, 数组结构, 多表, 多种数据接入等较丰富的功能,已经在内部得到比较广的使用。
我们对大数据的另外一个重要应用是对业务的自动诊断。 有了实时的全链路的数据闭环、数据回流,能够对算法进行自动化的迭代优化。同时也能够对业务进行全方位的监控和诊断, 哪些环节有问题, 到底是人的匹配问题, 还是货的定位问题, 都是根据数据去分析定位。
图3-3 大数据产品功能演示
这是我们对现有的大数据产品的demo,目前还在内测期, 从行业洞察到消费者洞察再到细微产品分析的功能已经比较完整。未来这个大数据产品,我们希望开放出去,寻找更多的合作商,把数据的价值放大。
最后介绍下我们对CBM数据智能的一些设想, 目前我们在智能化方向上只是前进了一小步, 离智能商业, 机器完全自动化决策还有很长的路,在众多领域还需要持续研究积累。
在消费者洞察这块, 我们对人的理解还是偏浅层次的, 需要深入到人的消费动机的理解, 做动因分析, 才能更精准地理解消费者需求; 在行业知识这块, 目前我们背后的知识图谱还未深入到生产知识领域, 各行业知识的积累还有很大空间,更完整的知识体系才能支撑更全面的机器决策; 在全域数据这块, 今天新零售在线下大面积铺开, 如何实现跟各线下渠道的数据打通, 数据回流, 实现对线下商业的赋能, 也是重要的一个方向。
原文发布时间为:2018-10-8
本文作者:干城