数据实践之美:34位大数据专家的方法、技术与思想. NO.3 企业数据化管理之巅—同业对标

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

NO.3

企业数据化管理之巅—同业对标

王卫东

资深数据分析师、软件工程师,曾为国家电网、多家保险公司、零售企业等客户做过数据资产规划与管理、企业数据中心建设、数据可视化模型设计、指标预测模型设计等工作,具有丰富的数据分析和商业智能项目实战经验,现主要从事企业征信相关数据分析与挖掘工作。

随着企业对数据资产的重视,数据的使用频率也在不断增多,如何利用数据管理企业成为数据服务于企业的思考点。目前,企业日常管理中已经有很多方面采用了数据化管理方式,比如薪酬管理、KPI管理、人力资源量化管理、绩效管理等,本文介绍的同业对标管理也是数据化管理的一种。

最早的、有记载的竞争性对标被公认为是美国施乐公司在20世纪70年代的大规模同业对标。陈泓冰教授创建了全面标杆管理体系,目前国内已有众多行业采用了同业对标进行企业管理,比如电力行业、能源行业、电信行业、烟草行业,等等。下面主要从同业对标体系的建设和实施、企业数据体系的优化和完善、如何通过同业对标体系提升企业管理三个大方面展开,为旨在建立一种数据化管理方案的公司提供一套可行性的参考方案。

 

站在金字塔尖—构建同业对标体系

1.为管理服务的对标体系

对标体系的建设应从企业总体管理方针出发,以各部门职能为设定相应目标的主要依据,可参照陈泓冰教授在著作《标杆兴国》中提出的新对标管理分类:竞争性对标、功能性对标、流程对标、内部对标、指标对标五大分类进行指标体系框架构建,从企业经营数据中选取指标。同业对标体系中的指标选取需要遵循以下几点原则:

(1)客观性:指标的含义要准确、具体,不可含糊不清,更不能用一些抽象的概念来作为衡量标准;指标尽可能量化,选取的考核指标可以分为定性指标和定量指标,定性指标在量化上存在一定的问题,应尽量使用定量指标;指标权重在整个评价体系中不可太高或太低,一般不超过30%或不低于5%,关键指标数量控制在5~8个。

(2)可行性:初次构建同业对标指标体系时,建议与指标最终结果息息相关的业务人员及领导参与制定,这样才能保证最终的考核结果客观可靠,能够被各部门、分级机构接受,并且具体指标归属具体责任部门或责任单位。指标的评价标准可定期进行评估并略加修改,一般一年进行一次。

(3)时限性:对指标的考核时间应该有相应的准则,通常采用季度、半年度、年度三种考核频度。这样可以避免一些指标效果需要较长时间才能反映企业的真实情况时,短时间高频度的考核造成结果偏差。

(4)公正性:企业每进行一次考核应该及时将考核结果反馈,使企业及时了解经营中的优劣势。

参照以上原则,企业可制定出符合企业现状的同业对标指标体系,参照表1所示的样例设计。

表1 指标体系模板

考 核 项 目  指 标 名 称  权  重         指标说明及考核标准     得  分

                                    

                                    

 

2.精准化管理的指标评价方法

(1)正态分布法

正态分布又名高斯分布,是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。

其主要特征为:

集中性,正态曲线的高峰位于正中央,即均数所在的位置;

对称性,正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交;

均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降;

正态分布有两个参数,即均数和标准差,可记作N(, ):均数决定正态曲线的中心位置;标准差决定正态曲线的陡峭或扁平程度。越小,曲线越陡峭;越大,曲线越扁平;变换:为了便于描述和应用,常将正态变量作数据转换。

对于经检验符合正态分布的一组指标数据,分别以+1、+0.33、-0.33和-1为分位点,其为指标数据的平均值=,为指标数据的标准差=。采用

表1-2中的指标数据进行计算,得到平均数=7.02,标准差=2.6,四个分位点分别为4.42、6.16、7.88、9.62,指标将落到相应的分段区间内,每个区间对应一个分值。

表2 正态分布法评分样例

机 构 名 称  指 标 值     正态分布区间         正态分布属性         得  分

机构A      9.56 7.88≤X<9.62         较高         0.8

机构B      3.98 X<4.42   低     0.2

机构C      7.21 6.16≤X<7.88         中等         0.6

机构D     7.85 6.16≤X<7.88         中等         0.6

机构E      3.76 X<4.42   低     0.2

机构F      10.49        X≥9.62   高     1.0

机构G     3.78 X<4.42   低     0.2

机构H     9.79 X≥9.62   高     1.0

机构I       5.51 4.42≤X<6.16         较低         0.4

机构J       8.23 7.88≤X<9.62         高     1.0

 

(2)五分位法

五分位法是按照等分或非等分方式进行分段统计与分析,对所有参与评价的机构的某个指标按照指标值进行数值大小排序,然后分为五等分,每个部分大约包含排名的五分之一。将属性分为高、较高、中等、较低、低五类。通常也有四分位法,基本计算逻辑和方法相同,例如某知名财经网站对上市公司股票的关键指标进行评价时,采用的是等分的四分位法。

等分五分位法就是将一组数据按四个百分位数划分为5个区间。通常我们采用的四个百分位数为20%、40%、60%、80%,如果是非等分五分位法,采用标准正态分布分段比例,对应的四个百分位数为16%、37%、63%、84%。一般使用Excel工作表中的percentile函数进行自动计算,percentile函数的两个参数为数组和百分位数。采用表1-3中的指标值组成的数组,利用Excel工作表中的percentile函数计算出对应的四个五分位值为:7.95、8.88、9.88、10.06。样例中的指标为正向指标,即指标值越大越好,对于指标值越小越好的负向指标,五分位属性相反。

表3 非等分五分位法评分样例

机 构 名 称  指 标 值     五分位区间     五分位属性     得  分

机构A      10.12        X≥10.06 高     1.0

机构B      10.22        X≥10.06 高     1.0

机构C      9.80 8.88≤X<9.88         中等         0.6

机构D     8.21 7.95≤X<8.88         较低         0.4

机构E      10.01        9.88≤X<10.06       较高         0.8

机构F      6.54 X<7.95   低     0.2

机构G     7.69 X<7.95   低     0.2

机构H     8.01 7.95≤X<8.88         较低         0.4

机构I       9.32 8.88≤X<9.88         中等         0.6

机构J       10.05        9.88≤X<10.06       较高         0.8

 

(3)归一化法

归一化法又称数据的归一化处理,是数据的标准化中最典型的一种,即将数据统一映射到[0, 1]区间上。归一化处理的目的是将数据按比例缩放,使之落入一个小的特定区间。在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。

常见的数据归一化方法有:

1)min-max标准化(Min-max normalization),也叫离差标准化,是对原始数据的线性变换,使结果落到[0, 1]区间,转换函数如下:

其中max为样本数据的最大值,min为样本数据的最小值。这种方法有一个缺陷就是当有新数据加入时,可能导致max和min的变化,需要重新定义。

2)log函数转换,通过以10为底的log函数转换的方法同样可以实现归一化,具体方法如下:

x*=log10(x)/log10(max)

3)atan函数转换,用反正切函数也可以实现数据的归一化:

x*=atan(x)*2/π

使用这个方法需要注意的是如果想映射的区间为[0, 1],则数据都应该大于等于0,小于0的数据将被映射到[-1, 0]区间上。

4)z-score 标准化(zero-mean normalization),也叫标准差标准化,是最常见的标准化方法,也是SPSS中最为常用的标准化方法,经过处理的数据符合标准正态分布,即均值为0,标准差为1,其转化函数为:

其中为所有样本数据的均值,为所有样本数据的标准差。

通常我们在采用归一化法做指标评价时采用min-max标准化,也可采用z-score 标准化。这里以前者为例,选取部分数据作为示例。假如表4为一个评价周期区间内,某公司下属分支机构的某项指标的情况,根据min-max标准化法转换公式,其中最小值min为6.54,最大值max为10.22,按照计算公式,保留两位小数,四舍五入得出得分列和名次列。需要说明的是这种计算方式为正向指标,即指标值越大越好,对于指标值越小越好的负向指标(逆向指标),计算方式需要稍作调整。

表4 min-max标准化评分样例

机 构 名 称  指 标 值     得分计算过程         得  分         名  次

机构A      10.12        (10.12-6.54)/(10.22-6.54)        0.97 2

机构B      10.22        (10.22-6.54)/(10.22-6.54)        1.00 1

机构C      9.80 (9.8-6.54)/(10.22-6.54)    0.89 5

机构D     8.21 (8.21-6.54)/(10.22-6.54) 0.45 7

机构E      10.01        (10.01-6.54)/(10.22-6.54)        0.94 4

机构F      6.54 (6.54-6.54)/(10.22-6.54) 0.00 10

机构G     7.69 (7.69-6.54)/(10.22-6.54) 0.31 9

机构H     8.01 (8.01-6.54)/(10.22-6.54) 0.40 8

机构I       9.32 (9.32-6.54)/(10.22-6.54) 0.76 6

机构J       10.05        (10.05-6.54)/(10.22-6.54)        0.95 3

 

夯实金字塔基座—完善企业数据体系

1.同业对标指标分析体系

(1)横向分析

横向分析是指一个企业与其他企业在同一时点(或时期)上的比较,是一种针对性较强的分析方法。

一般在做针对性的单一指标分析时,会采用横向分析方法,在分析表现形式上可选择带有趋势线的柱状图,趋势线的选择可根据指标的特殊性进行选取,如图1中趋势线为平均线,根据指标按照一定的排序规则进行排序,更便于快速定位企业所处位置。

 

图1 横向分析法

(2)纵向分析

纵向分析是指同一企业不同时期的指标情况分析,习惯上把企业连续一段统计周期内的经营数据纵向排成一列,对比不同时期企业的经营业绩,是分析企业经营变化趋势的一种有效方式。

一般在做指标的周期性变化分析时会采用纵向分析方法,在分析表现形式上可选择折线图,如图2所示。

(3)标杆分析

标杆分析一般在对SBU、部门、组织或公司的同类比较中非常有用,通过比较可以得知组织到底表现如何,发现企业的优势和不足。标杆的选择一般有两种:一种是以竞争对手为标杆,有助于确定和比较竞争对手经营战略的组成要素;另一种是以一流企业为标杆,可以改进企业的内部经营,建立相应的赶超目标。

 

图2 纵向分析法

一般在做标杆分析时会选择一组关键指标得分或者指标值开展分析,而不会单独针对某个指标开展,比如企业的销售、市场、管理、信息技术、客服等,在分析表现形式上可选择雷达图(蜘蛛图),如图3所示。

 

图3 标杆分析中的雷达图

(4)因子分析和回归分析

因子分析是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子,以较少的几个因子反映原资料的大部分信息。回归分析是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法,运用十分广泛。回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。

因子分析一般适用于定性的、不可观测的数据,而回归分析是通过几个相互独立的指标数据建立数据模型。图4是利用Tableau工具根据销售数据和地区人口做的一个简单的一元线性回归模型,图5为对应的趋势模型分析结果。复杂模型的建立可以使用专业的统计分析软件和程序,目前使用较多的有SPSS、SAS、R语言、Matlab等,可根据实际情况选择。

 

图4 回归模型

 

图5 趋势模型分析结果

2.服务于管理的企业数据体系

从企业自身来讲,配套数据化服务的建设是为了辅助实现:提高管理水平、降低企业内耗、提高总体运营能力、提升竞争力等企业战略目标。通常,企业的数据化建设由数据和技术驱动,自下而上地构建企业数据体系(如图6,左)。即从基础数据平台、数据报表与可视化、分析与决策平台、数据产品、战略,实现数据从“多”到“少”的价值提炼过程。现实情况是很多企业在数据化建设过程中受限于多方面原因,只执行了整个体系前两层,并未构建图6左边虚线框内的三层。

有了同业对标体系,企业可以按照William H.Inmon对数据仓库进行定义,一个面向主题的、集成的、随时间变化的、非易变的用于支持管理的决策过程的数据集合,以实现同业对标管理为导向,自上而下地构建企业数据体系(如图2-6,右),即从同业对标体系、指标报表与可视化、指标综合分析平台、基础数据平台,实现从“小”到“大”的数据资产收集与价值利用。

 

图6 企业数据体系

企业在进行同业对标主题的数据体系构建时,每个层次都会有相应的信息化系统建设(或者是某个相关系统模块)来支撑和完善整个体系的运转,下面描述了各个层级建设的核心工作和目标:

(1)同业对标

该层级处在整个金字塔体系的最顶端,也是整个数据体系的核心目标,数据结果一般作为定期对外公布和考核的依据,结合同业对标评价周期,可产出月度、季度、半年度和年度等考核结果。

(2)指标报表和可视化

以同业对标的分析和结果展示为建设目标,其中指标报表更加明确指标值和得分等情况,细分到部门、分公司等,以便进行单指标的横向对比;可视化建设作为一种更形象直观的数据表现形式,通常建设的有大屏可视化、领导驾驶舱等可视化平台。

(3)指标综合分析平台

综合分析平台涉及指标的深度分析和价值挖掘,对指标进行深层次分解,结合相关指标数据和相应的分析方法论进行指标深度分析,比如采用回归分析建立指标计算模型,利用计算模型开展指标预测。

(4)基础数据平台

作为整个数据体系建设的根基,汇聚所有同业对标用到的数据,并确保数据的准确、及时、完整等,主要用作细粒度数据的收集、管理、监控,同时支撑上层指标的计算依据,并对外提供接口等服务。

破解金字塔之谜—解决企业管理

1.追根溯源,抓出蠕虫

杜邦分析法是利用各个主要财务比率之间的内在联系,建立财务比率分析的综合模型,来综合地分析和评价企业财务状况和经营业绩的方法。采用杜邦分析图将有关分析指标按内在联系加以排列,从而直观地反映出企业的财务状况和经营成果的总体面貌。

从定义上看,杜邦分析法是从财务角度评价企业经营绩效的一种经典方法。通常情况下在对一些关键指标进行分析时,可根据行业特征和指标内在联系,建立分析模型开展层层分析,去伪存真,排除眼前的疑惑目标,挖掘出问题的根源。同时结合前面的分析方法有针对性地提升也是一种常用的分析思路,局限性在于不是所有的指标都能够直观地建立起分析模型,有时候需要借助一些数据挖掘工具来创建指标模型。图7是某保险公司针对综合成本率指标做的指标分解模型(在实际保险业务中还可以进行更深层次的分解),利用模型可以对业务做有目的性和针对性的调整和优化。

综合成本率指标作为保险行业同业对标体系中的一个重要考核指标(也有企业将因子指标综合赔付率和综合费用率分别作为同业对标体系中的指标),对其展开深度

 

图7 综合成本率指标分解模型

分析,提高企业核心竞争力具有重要意义。通过该指标和同业企业进行对标时就有了针对性的意义,当综合成本率过高时,我们可以对其相关因子指标一层层地做透析分析,找出引起指标变化的因子变量,首先分析综合赔付率和综合费用率两项指标的变化情况,同样的方法,层层分解直到找出引起指标变化的实际业务数据,在实际业务中改善。

2.未雨绸缪,优化补强

企业在经营中往往会提前制定可行性的目标和实施方案,数据化预测模型则是企业在做可行性方案时的重要依据,模型一般需要具备可操作、可量化等特点,而且在实际过程中会针对不同的指标设置相应的阈值,实现过程监控和预警。

预测模型的实施有两个出发点:从管理角度提升综合竞争力和排名,同业对标的考核以得分为最终判断标准,根据指标权重和指标得分,为全面提高得分提升企业排名,以目标为导向有针对性地调整经营策略;从经营角度改善业务指标状况,业务指标值是企业得分计算的依据,以过程为导向有针对性地进行业务改善和加强。

如果整个企业的同业对标体系过于庞大,并且多数指标都有相应的分析模型,就需要使用专业的企业规划软件进行目标的设定和预算的编制,它可以很好地帮助我们分析数据和建立模型。

同业对标管理是现代企业众多量化管理模型中的一种,整篇文章简要地描述了企业实施同业对标管理时的主要步骤和一些相关的分析方法,希望通过本文可以给想要开展同业对标管理的企业提供参考。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
9天前
|
分布式计算 Shell MaxCompute
odps测试表及大量数据构建测试
odps测试表及大量数据构建测试
|
11天前
|
数据采集 人工智能 分布式计算
MaxFrame:链接大数据与AI的高效分布式计算框架深度评测与实践!
阿里云推出的MaxFrame是链接大数据与AI的分布式Python计算框架,提供类似Pandas的操作接口和分布式处理能力。本文从部署、功能验证到实际场景全面评测MaxFrame,涵盖分布式Pandas操作、大语言模型数据预处理及企业级应用。结果显示,MaxFrame在处理大规模数据时性能显著提升,代码兼容性强,适合从数据清洗到训练数据生成的全链路场景...
38 5
MaxFrame:链接大数据与AI的高效分布式计算框架深度评测与实践!
|
2月前
|
存储 消息中间件 分布式计算
Cisco WebEx 数据平台:统一 Trino、Pinot、Iceberg 及 Kyuubi,探索 Apache Doris 在 Cisco 的改造实践
Cisco WebEx 早期数据平台采用了多系统架构(包括 Trino、Pinot、Iceberg 、 Kyuubi 等),面临架构复杂、数据冗余存储、运维困难、资源利用率低、数据时效性差等问题。因此,引入 Apache Doris 替换了 Trino、Pinot 、 Iceberg 及 Kyuubi 技术栈,依赖于 Doris 的实时数据湖能力及高性能 OLAP 分析能力,统一数据湖仓及查询分析引擎,显著提升了查询性能及系统稳定性,同时实现资源成本降低 30%。
Cisco WebEx 数据平台:统一 Trino、Pinot、Iceberg 及 Kyuubi,探索 Apache Doris 在 Cisco 的改造实践
|
25天前
|
分布式计算 大数据 数据处理
技术评测:MaxCompute MaxFrame——阿里云自研分布式计算框架的Python编程接口
随着大数据和人工智能技术的发展,数据处理的需求日益增长。阿里云推出的MaxCompute MaxFrame(简称“MaxFrame”)是一个专为Python开发者设计的分布式计算框架,它不仅支持Python编程接口,还能直接利用MaxCompute的云原生大数据计算资源和服务。本文将通过一系列最佳实践测评,探讨MaxFrame在分布式Pandas处理以及大语言模型数据处理场景中的表现,并分析其在实际工作中的应用潜力。
62 2
|
1月前
|
SQL 运维 大数据
轻量级的大数据处理技术
现代大数据应用架构中,数据中心作为核心,连接数据源与应用,承担着数据处理与服务的重要角色。然而,随着数据量的激增,数据中心面临运维复杂、体系封闭及应用间耦合性高等挑战。为缓解这些问题,一种轻量级的解决方案——esProc SPL应运而生。esProc SPL通过集成性、开放性、高性能、数据路由和敏捷性等特性,有效解决了现有架构的不足,实现了灵活高效的数据处理,特别适用于应用端的前置计算,降低了整体成本和复杂度。
|
2月前
|
机器学习/深度学习 存储 大数据
在大数据时代,高维数据处理成为难题,主成分分析(PCA)作为一种有效的数据降维技术,通过线性变换将数据投影到新的坐标系
在大数据时代,高维数据处理成为难题,主成分分析(PCA)作为一种有效的数据降维技术,通过线性变换将数据投影到新的坐标系,保留最大方差信息,实现数据压缩、去噪及可视化。本文详解PCA原理、步骤及其Python实现,探讨其在图像压缩、特征提取等领域的应用,并指出使用时的注意事项,旨在帮助读者掌握这一强大工具。
116 4
|
2月前
|
存储 大数据 数据管理
大数据分区简化数据维护
大数据分区简化数据维护
31 4
|
2月前
|
存储 机器学习/深度学习 大数据
量子计算与大数据:处理海量信息的新方法
量子计算作为革命性的计算范式,凭借量子比特和量子门的独特优势,展现出在大数据处理中的巨大潜力。本文探讨了量子计算的基本原理、在大数据处理中的应用及面临的挑战与前景,展望了其在金融、医疗和物流等领域的广泛应用。
|
3月前
|
存储 机器学习/深度学习 分布式计算
大数据技术——解锁数据的力量,引领未来趋势
【10月更文挑战第5天】大数据技术——解锁数据的力量,引领未来趋势
|
2月前
|
存储 分布式计算 数据挖掘
数据架构 ODPS 是什么?
数据架构 ODPS 是什么?
518 7