近10年数据智能团队建设,联想总结了由内而外的发展经验 | 专访联想集团副总裁田日辉

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: 近10年数据智能团队建设,联想总结了由内而外的发展经验 | 专访联想集团副总裁田日辉

去年6月,联想集团公开宣布,成立数据智能业务集团 (Data Intelligence Business Group,DIBG),由蓝烨担任高级副总裁,直接向杨元庆汇报。同时,联想集团副总裁田日辉负责数据智能业务集团的产品和生态业务,汇报给蓝烨。

在当时写给数据智能业务集团的内部信中,联想集团董事长兼首席执行官杨元庆表示,“在大数据积累的基础上成立联想数据智能业务集团,是为了加速智能化变革,是实施联想行业智能(Smart Verticals)战略的重要举措。”

这也是一直被外界誉为信息化标杆企业的联想,向数据智能领域延伸业务的一次重要的商业布局。

其实联想内部广义上的信息化早在2000年左右就开启了。经过20多年的信息化实践和积累,联想目前的大型主系统有上千套,整个公司服务器加起来有上万台,数据链量级已经达到十几个PB。

同时,联想在全球都运营着庞大的上下游生态,在全球两百多个国家和地区同步进行用户服务与体系构建,目前有50多家上游企业,2000多家下游渠道企业。

经过一年的发展,联想数据智能业务集团发展如何?联想集团的数据平台构建与数据团队建设又有怎样的进展?针对以上问题,上个月,我们对联想数据智能业务集团产品及生态总经理田日辉先生进行了一次专访。

三阶段数据团队建设,打造全价值链数据智能平台

在成立数据智能业务集团之前,联想内部的数据团队其实已经初具规模,团队建设也不是一蹴而就的。

自2011年联想开始应用大数据至今,联想的数据平台建设主要可以划分成三个阶段:
第一阶段:企业内部先进数据应用建设;
第二阶段:在内部和外部构建平台;
第三个阶段:构建上下游企业的数据智能生态。

2011年到2015年是联想数字团队建设的起步阶段。当时的数据团队还主要是服务联想内部拓展数据的应用,因此数据团队的规模很小,只有十几个人,四年后慢慢扩展到一百多人。

田日辉告诉我们,当时团队研发中国第一款安卓系统手机乐phone,通过应用商店、SBK模拟器、开发环境与数据分析工具等来构建一套大数据体系,进而帮助应用商店开发者收集相关使用数据。联想的数据团队最早就是从此入手,帮助应用商店的开发者分析月活、日活与产品质量等数据,持续不断优化这些智能应用。

田日辉表示,在初期内部硬件的生产上,联想就对于信息化比较重视,是国内首批使用ERP的企业之一,因为自2004年收购IBM 的PC业务后,全球化运作对信息系统的要求较高,IBM原本的很多系统被逐渐废掉,联想也构建了自有系统,提升效率。

之后随着这些应用的深入,大数据不仅能在应用层对产品提供优化,企业内部大量的运营数据,对企业产品研发、供应链管理、市场营销还有很多影响,使得数据应用可以扩展到整个延产供销服务全价值链。

2016年到2019年下半年,联想开始进入了数据团队建设的第二阶段,开始把数据应用大规模进行平台化和推广,并开始将能力对外输出,拓展给外部用户,并在公司内部构建平台。

这一阶段,联想开始有计划的建设全公司“人人都能使用”的数据平台,“这个过程中,公司内部核心策略就是人人都是分析师。”

田日辉提到,数据团队负责建平台,把核心数据和公用数据帮用户整理好;业务人员(IT部门、业务部门等)完成平台分析工作,大量人员参与进来,使得业务经验能够与数据分析方法更好结合起来,以自服务式应用致力于解决数据科学家缺失的难题。数据团队开发平台性产品之后,在公司内部先部署与使用,比较成熟之后,再服务外部客户(汽车、石化、钢铁等企业)。外部客户因为和与内部的应用模式有所不同,有很多创新的需求和应用点,通过反馈去优化产品,增加内部应用平台的功能特性,并建立内外部互动模式。

而到了现在,联想数据团队建设已经进入了构建生态化阶段。联想所处的行业生态链中,上下游企业都处于数据智能转型时期,联想数据团队现在已经构建了上下游合作伙伴都能利用的智能化应用平台。平台除了提供算法工具之外,还预置了多年积累的分析数据模型,包括预测、仓储优化、用户画像、精准营销等,使合作伙伴能够很快地使用,把数据与业务模型对接,实现业务价值闭环。上下游企业可以选择用联想平台去做智能化软件,也可以使用联想的产品构建私有平台。下游大量中小型制造业企业受限于信息化成本,在数字化转型过程面临很多挑战,建立生态系统可以使其直接使用经过实践验证的平台。

联想希望在对外服务的同时,也能够建立起生态系统,服务更多的尤其是中小企业客户,推动中国智能制造快速转型。

内外部数据治理结合,优化数据平台结构

细数数据团队建设的三个阶段,田日辉对第二个阶段的印象最为深刻。

和很多业务部门较多的集团型企业一样,业务规模如此庞大的联想也面临着数据分散在不同的业务系统中,难以整合的痛点。数据团队建设在初具规模之后的最重要任务,就是建立起一个更完善的企业级数据分析平台,把这些内部分散的数据以集中的方式进行整合管理并科学地利用起来。

正如上文提到,联想注重业务与数据团队的紧密结合,内部的数据团队与不同业务部门分工合作。因此从2016年开始,联想就开始把联想几十年信息化中的大小数据系统整合起来,形成企业整体数据湖,并构建统一的数据模型。

数据团队在中央提供分析算法工具,积累推广模型,提供复杂建模过程的二线帮助并举办培训活动,辅助业务部门采取自助式的服务。

田日辉给我们举了个销量预测的例子,说明联想数据智能团队内部是如何使用内部流程化工具为业务部门提供辅助的。

联想生产销售各种复杂的设备,因此销量预测是多层次的,总销量预测会分不同地区和不同产品线。在不断发展中,数据团队把预测模型放到平台上,通过几轮配型后,进行模型积累。平台本身提供很多分析和算法工具,使业务人员运用不同的数据级,使用自动化机器学习工具测试不同的算法,并给出最优结果,同时根据业务实践来判断哪个参数和配置最符合要求。

由于相关数据表极其庞大,可能会存在一些数据冲突,因此公司级大平台可以进行统一数据治理,让所有人的分析工作达到比较好的效果。

要做一个有效的预测或者优化,数据链,尤其数据的广度是非常关键的,因此联想也引入了很多外部数据。在内部平台建设的同时,联想接入大量外部数据进行合作。合作的供应商、市场预测部门、客户满意度调查,各种产品质量反馈等数据都会作为外部数据汇总进来。

内部的数据平台建设逐渐成熟后,联想的数据团队也开始将数据能力输出给提供商与服务提供商,更需要深入理解客户业务和机理模型。

对于外部行业客户,联想内部的数据科学家在专业知识理解方面相对薄弱。在进入行业初期,团队与客户的行业专家一起做项目,客户对企业的数据积累情况与行业的机理模型更清楚,而团队对数据与算法比较清楚。渐渐,客户本身会具备数据使用能力,团队也会积累一些所谓的行业专家,进而把应用模型带给其他客户。由于很多案例和应用框架可以复用,团队也一直在尝试加强对行业的理解,建立一些行业专家人才队伍。

因此,田日辉对于意向进入数据科学领域的高校学生,也提出了一些行业知识的期待。

“掌握新技术有较好的基础,且自学能力与使用能力强。但是应该更多理解企业的运营模式,业务需求和机理模型,多参加一些真正与实战相结合的活动,或到企业里面参与一些实际的工作与项目。”

明确团队绩效指标,“不是一件难事”

很多团队关心数据团队本身的商业影响力及其产生的价值,相比一些传统的部门,数据团队的价值比较难估计与量化。

但在联想内部,估算产出投入与价值却并不是一个很困难的事情。

田日辉提到,由于在第二阶段建设了全集团统一的数据平台,只需要了解公司内外对于数据平台的调用有多少,并且在平台内的操作帮助业务部门创造了多少价值即可。

具体来说,团队关键KPI有用户数,产生的价值量等。由于最终的应用由业务部门完成,完成这个项目后,它的质量提升了多少,它的预测精准度提高了多少,意味着多少业务价值,都是很明显的。

到了第三阶段,对于上下游企业来说,外部企业客户最直接的价值就是其购买产品与服务花费的数额,且客户对于投入产出比的敏感性,这个指标也是很容易衡量的。

举个例子,2017年底联想开始与中国顶尖的石化企业合作,一起做催化裂化装置的工艺参数优化。最后联想的投入是客户出资的五六倍,但是团队也乐于与跟客户一起,把石化行业的标杆客户拿下,这件事对企业有非常大的业务价值,且这类价值比较容易衡量。

今年的疫情期间,虽然全球经济都受到了影响,但是田日辉的团队并没有改变原有的发展路线图和考核标准。

田日辉告诉我们,从用户使用的角度来说,云模式的产品无论从分析还是从报表各方面,基本上没有太大的影响。中央的数据团队虽然在家里远程办公,数据用户也在家里办公,但是整个平台运转还是很正常。

疫情对团队业务本身供应链会有一些影响,即用户的需求。由于疫情影响,客户对联想的产品,无论是业内产品还是云服务的产品,以及数据智能转型服务这些产品的需求,都是有所提升的。联想的私有云给外部客户提供的服务略有影响,体现在团队帮助客户来构建私有云之后,在建设初期,需要做用户访谈和数据治理,和云业务部门有比较多的沟通,这些项目会受一定的影响,但是比例不是很大。在面对疫情等重大社会事件下的经济现状中,田日辉也希望团队保持积极心态,推定数据平台与服务升级,寻求稳定发展。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
供应链 算法 安全
|
人工智能 大数据 区块链
合作阿里两周年 澳门特区五大领域智能化成果初现
19日,记者获得消息称,澳门智能城市项目第一阶段已经成功验收,第二阶段在稳步推进中。自2017年8月和阿里巴巴达成智能城市战略合作以来,澳门特别行政区在交通、医疗、旅游、政务等领域广泛应用云计算以及数字金融技术。
1279 0
合作阿里两周年 澳门特区五大领域智能化成果初现
|
大数据 开发者
阿里巴巴、新华智云、高德、人人车 多位业内大数据技术专家齐聚,畅谈如何玩转轻资产的大数据服务!
云栖开发者沙龙介绍: 阿里云栖开发者沙龙是“云栖社区”主办的线下技术沙龙品牌,希望通过技术干货分享来打通线上线下专家和开发者的连接。沙龙每期将定位不同的技术方向,逐步覆盖 云计算,大数据,前端,PHP,Java ,android,AI,运维,测试 等技术领域,并会穿插一些特别专场(开源专场,女性开发者专场,开发者成长专场等)。
5355 0
|
机器学习/深度学习 人工智能 安全
2017 先知创新大会现场盘点 | 以干货彰显实力
量子密码的现有研究和未来趋势 议题:量子和相对论密码学:基于物理原理的信息安全 演讲嘉宾:施尧耘  阿里云首席量子技术科学家,之江实验室副主任 “大型量子计算机出现后,目前广泛使用的公钥密码系统都不安全了。
4115 0