数据实践之美:34位大数据专家的方法、技术与思想. NO.3 企业数据化管理之巅—同业对标

简介:

NO.3

企业数据化管理之巅—同业对标

王卫东

资深数据分析师、软件工程师,曾为国家电网、多家保险公司、零售企业等客户做过数据资产规划与管理、企业数据中心建设、数据可视化模型设计、指标预测模型设计等工作,具有丰富的数据分析和商业智能项目实战经验,现主要从事企业征信相关数据分析与挖掘工作。

随着企业对数据资产的重视,数据的使用频率也在不断增多,如何利用数据管理企业成为数据服务于企业的思考点。目前,企业日常管理中已经有很多方面采用了数据化管理方式,比如薪酬管理、KPI管理、人力资源量化管理、绩效管理等,本文介绍的同业对标管理也是数据化管理的一种。

最早的、有记载的竞争性对标被公认为是美国施乐公司在20世纪70年代的大规模同业对标。陈泓冰教授创建了全面标杆管理体系,目前国内已有众多行业采用了同业对标进行企业管理,比如电力行业、能源行业、电信行业、烟草行业,等等。下面主要从同业对标体系的建设和实施、企业数据体系的优化和完善、如何通过同业对标体系提升企业管理三个大方面展开,为旨在建立一种数据化管理方案的公司提供一套可行性的参考方案。

 

站在金字塔尖—构建同业对标体系

1.为管理服务的对标体系

对标体系的建设应从企业总体管理方针出发,以各部门职能为设定相应目标的主要依据,可参照陈泓冰教授在著作《标杆兴国》中提出的新对标管理分类:竞争性对标、功能性对标、流程对标、内部对标、指标对标五大分类进行指标体系框架构建,从企业经营数据中选取指标。同业对标体系中的指标选取需要遵循以下几点原则:

(1)客观性:指标的含义要准确、具体,不可含糊不清,更不能用一些抽象的概念来作为衡量标准;指标尽可能量化,选取的考核指标可以分为定性指标和定量指标,定性指标在量化上存在一定的问题,应尽量使用定量指标;指标权重在整个评价体系中不可太高或太低,一般不超过30%或不低于5%,关键指标数量控制在5~8个。

(2)可行性:初次构建同业对标指标体系时,建议与指标最终结果息息相关的业务人员及领导参与制定,这样才能保证最终的考核结果客观可靠,能够被各部门、分级机构接受,并且具体指标归属具体责任部门或责任单位。指标的评价标准可定期进行评估并略加修改,一般一年进行一次。

(3)时限性:对指标的考核时间应该有相应的准则,通常采用季度、半年度、年度三种考核频度。这样可以避免一些指标效果需要较长时间才能反映企业的真实情况时,短时间高频度的考核造成结果偏差。

(4)公正性:企业每进行一次考核应该及时将考核结果反馈,使企业及时了解经营中的优劣势。

参照以上原则,企业可制定出符合企业现状的同业对标指标体系,参照表1所示的样例设计。

表1 指标体系模板

考 核 项 目  指 标 名 称  权  重         指标说明及考核标准     得  分

                                    

                                    

 

2.精准化管理的指标评价方法

(1)正态分布法

正态分布又名高斯分布,是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。

其主要特征为:

集中性,正态曲线的高峰位于正中央,即均数所在的位置;

对称性,正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交;

均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降;

正态分布有两个参数,即均数和标准差,可记作N(, ):均数决定正态曲线的中心位置;标准差决定正态曲线的陡峭或扁平程度。越小,曲线越陡峭;越大,曲线越扁平;变换:为了便于描述和应用,常将正态变量作数据转换。

对于经检验符合正态分布的一组指标数据,分别以+1、+0.33、-0.33和-1为分位点,其为指标数据的平均值=,为指标数据的标准差=。采用

表1-2中的指标数据进行计算,得到平均数=7.02,标准差=2.6,四个分位点分别为4.42、6.16、7.88、9.62,指标将落到相应的分段区间内,每个区间对应一个分值。

表2 正态分布法评分样例

机 构 名 称  指 标 值     正态分布区间         正态分布属性         得  分

机构A      9.56 7.88≤X<9.62         较高         0.8

机构B      3.98 X<4.42   低     0.2

机构C      7.21 6.16≤X<7.88         中等         0.6

机构D     7.85 6.16≤X<7.88         中等         0.6

机构E      3.76 X<4.42   低     0.2

机构F      10.49        X≥9.62   高     1.0

机构G     3.78 X<4.42   低     0.2

机构H     9.79 X≥9.62   高     1.0

机构I       5.51 4.42≤X<6.16         较低         0.4

机构J       8.23 7.88≤X<9.62         高     1.0

 

(2)五分位法

五分位法是按照等分或非等分方式进行分段统计与分析,对所有参与评价的机构的某个指标按照指标值进行数值大小排序,然后分为五等分,每个部分大约包含排名的五分之一。将属性分为高、较高、中等、较低、低五类。通常也有四分位法,基本计算逻辑和方法相同,例如某知名财经网站对上市公司股票的关键指标进行评价时,采用的是等分的四分位法。

等分五分位法就是将一组数据按四个百分位数划分为5个区间。通常我们采用的四个百分位数为20%、40%、60%、80%,如果是非等分五分位法,采用标准正态分布分段比例,对应的四个百分位数为16%、37%、63%、84%。一般使用Excel工作表中的percentile函数进行自动计算,percentile函数的两个参数为数组和百分位数。采用表1-3中的指标值组成的数组,利用Excel工作表中的percentile函数计算出对应的四个五分位值为:7.95、8.88、9.88、10.06。样例中的指标为正向指标,即指标值越大越好,对于指标值越小越好的负向指标,五分位属性相反。

表3 非等分五分位法评分样例

机 构 名 称  指 标 值     五分位区间     五分位属性     得  分

机构A      10.12        X≥10.06 高     1.0

机构B      10.22        X≥10.06 高     1.0

机构C      9.80 8.88≤X<9.88         中等         0.6

机构D     8.21 7.95≤X<8.88         较低         0.4

机构E      10.01        9.88≤X<10.06       较高         0.8

机构F      6.54 X<7.95   低     0.2

机构G     7.69 X<7.95   低     0.2

机构H     8.01 7.95≤X<8.88         较低         0.4

机构I       9.32 8.88≤X<9.88         中等         0.6

机构J       10.05        9.88≤X<10.06       较高         0.8

 

(3)归一化法

归一化法又称数据的归一化处理,是数据的标准化中最典型的一种,即将数据统一映射到[0, 1]区间上。归一化处理的目的是将数据按比例缩放,使之落入一个小的特定区间。在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。

常见的数据归一化方法有:

1)min-max标准化(Min-max normalization),也叫离差标准化,是对原始数据的线性变换,使结果落到[0, 1]区间,转换函数如下:

其中max为样本数据的最大值,min为样本数据的最小值。这种方法有一个缺陷就是当有新数据加入时,可能导致max和min的变化,需要重新定义。

2)log函数转换,通过以10为底的log函数转换的方法同样可以实现归一化,具体方法如下:

x*=log10(x)/log10(max)

3)atan函数转换,用反正切函数也可以实现数据的归一化:

x*=atan(x)*2/π

使用这个方法需要注意的是如果想映射的区间为[0, 1],则数据都应该大于等于0,小于0的数据将被映射到[-1, 0]区间上。

4)z-score 标准化(zero-mean normalization),也叫标准差标准化,是最常见的标准化方法,也是SPSS中最为常用的标准化方法,经过处理的数据符合标准正态分布,即均值为0,标准差为1,其转化函数为:

其中为所有样本数据的均值,为所有样本数据的标准差。

通常我们在采用归一化法做指标评价时采用min-max标准化,也可采用z-score 标准化。这里以前者为例,选取部分数据作为示例。假如表4为一个评价周期区间内,某公司下属分支机构的某项指标的情况,根据min-max标准化法转换公式,其中最小值min为6.54,最大值max为10.22,按照计算公式,保留两位小数,四舍五入得出得分列和名次列。需要说明的是这种计算方式为正向指标,即指标值越大越好,对于指标值越小越好的负向指标(逆向指标),计算方式需要稍作调整。

表4 min-max标准化评分样例

机 构 名 称  指 标 值     得分计算过程         得  分         名  次

机构A      10.12        (10.12-6.54)/(10.22-6.54)        0.97 2

机构B      10.22        (10.22-6.54)/(10.22-6.54)        1.00 1

机构C      9.80 (9.8-6.54)/(10.22-6.54)    0.89 5

机构D     8.21 (8.21-6.54)/(10.22-6.54) 0.45 7

机构E      10.01        (10.01-6.54)/(10.22-6.54)        0.94 4

机构F      6.54 (6.54-6.54)/(10.22-6.54) 0.00 10

机构G     7.69 (7.69-6.54)/(10.22-6.54) 0.31 9

机构H     8.01 (8.01-6.54)/(10.22-6.54) 0.40 8

机构I       9.32 (9.32-6.54)/(10.22-6.54) 0.76 6

机构J       10.05        (10.05-6.54)/(10.22-6.54)        0.95 3

 

夯实金字塔基座—完善企业数据体系

1.同业对标指标分析体系

(1)横向分析

横向分析是指一个企业与其他企业在同一时点(或时期)上的比较,是一种针对性较强的分析方法。

一般在做针对性的单一指标分析时,会采用横向分析方法,在分析表现形式上可选择带有趋势线的柱状图,趋势线的选择可根据指标的特殊性进行选取,如图1中趋势线为平均线,根据指标按照一定的排序规则进行排序,更便于快速定位企业所处位置。

 

图1 横向分析法

(2)纵向分析

纵向分析是指同一企业不同时期的指标情况分析,习惯上把企业连续一段统计周期内的经营数据纵向排成一列,对比不同时期企业的经营业绩,是分析企业经营变化趋势的一种有效方式。

一般在做指标的周期性变化分析时会采用纵向分析方法,在分析表现形式上可选择折线图,如图2所示。

(3)标杆分析

标杆分析一般在对SBU、部门、组织或公司的同类比较中非常有用,通过比较可以得知组织到底表现如何,发现企业的优势和不足。标杆的选择一般有两种:一种是以竞争对手为标杆,有助于确定和比较竞争对手经营战略的组成要素;另一种是以一流企业为标杆,可以改进企业的内部经营,建立相应的赶超目标。

 

图2 纵向分析法

一般在做标杆分析时会选择一组关键指标得分或者指标值开展分析,而不会单独针对某个指标开展,比如企业的销售、市场、管理、信息技术、客服等,在分析表现形式上可选择雷达图(蜘蛛图),如图3所示。

 

图3 标杆分析中的雷达图

(4)因子分析和回归分析

因子分析是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子,以较少的几个因子反映原资料的大部分信息。回归分析是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法,运用十分广泛。回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。

因子分析一般适用于定性的、不可观测的数据,而回归分析是通过几个相互独立的指标数据建立数据模型。图4是利用Tableau工具根据销售数据和地区人口做的一个简单的一元线性回归模型,图5为对应的趋势模型分析结果。复杂模型的建立可以使用专业的统计分析软件和程序,目前使用较多的有SPSS、SAS、R语言、Matlab等,可根据实际情况选择。

 

图4 回归模型

 

图5 趋势模型分析结果

2.服务于管理的企业数据体系

从企业自身来讲,配套数据化服务的建设是为了辅助实现:提高管理水平、降低企业内耗、提高总体运营能力、提升竞争力等企业战略目标。通常,企业的数据化建设由数据和技术驱动,自下而上地构建企业数据体系(如图6,左)。即从基础数据平台、数据报表与可视化、分析与决策平台、数据产品、战略,实现数据从“多”到“少”的价值提炼过程。现实情况是很多企业在数据化建设过程中受限于多方面原因,只执行了整个体系前两层,并未构建图6左边虚线框内的三层。

有了同业对标体系,企业可以按照William H.Inmon对数据仓库进行定义,一个面向主题的、集成的、随时间变化的、非易变的用于支持管理的决策过程的数据集合,以实现同业对标管理为导向,自上而下地构建企业数据体系(如图2-6,右),即从同业对标体系、指标报表与可视化、指标综合分析平台、基础数据平台,实现从“小”到“大”的数据资产收集与价值利用。

 

图6 企业数据体系

企业在进行同业对标主题的数据体系构建时,每个层次都会有相应的信息化系统建设(或者是某个相关系统模块)来支撑和完善整个体系的运转,下面描述了各个层级建设的核心工作和目标:

(1)同业对标

该层级处在整个金字塔体系的最顶端,也是整个数据体系的核心目标,数据结果一般作为定期对外公布和考核的依据,结合同业对标评价周期,可产出月度、季度、半年度和年度等考核结果。

(2)指标报表和可视化

以同业对标的分析和结果展示为建设目标,其中指标报表更加明确指标值和得分等情况,细分到部门、分公司等,以便进行单指标的横向对比;可视化建设作为一种更形象直观的数据表现形式,通常建设的有大屏可视化、领导驾驶舱等可视化平台。

(3)指标综合分析平台

综合分析平台涉及指标的深度分析和价值挖掘,对指标进行深层次分解,结合相关指标数据和相应的分析方法论进行指标深度分析,比如采用回归分析建立指标计算模型,利用计算模型开展指标预测。

(4)基础数据平台

作为整个数据体系建设的根基,汇聚所有同业对标用到的数据,并确保数据的准确、及时、完整等,主要用作细粒度数据的收集、管理、监控,同时支撑上层指标的计算依据,并对外提供接口等服务。

破解金字塔之谜—解决企业管理

1.追根溯源,抓出蠕虫

杜邦分析法是利用各个主要财务比率之间的内在联系,建立财务比率分析的综合模型,来综合地分析和评价企业财务状况和经营业绩的方法。采用杜邦分析图将有关分析指标按内在联系加以排列,从而直观地反映出企业的财务状况和经营成果的总体面貌。

从定义上看,杜邦分析法是从财务角度评价企业经营绩效的一种经典方法。通常情况下在对一些关键指标进行分析时,可根据行业特征和指标内在联系,建立分析模型开展层层分析,去伪存真,排除眼前的疑惑目标,挖掘出问题的根源。同时结合前面的分析方法有针对性地提升也是一种常用的分析思路,局限性在于不是所有的指标都能够直观地建立起分析模型,有时候需要借助一些数据挖掘工具来创建指标模型。图7是某保险公司针对综合成本率指标做的指标分解模型(在实际保险业务中还可以进行更深层次的分解),利用模型可以对业务做有目的性和针对性的调整和优化。

综合成本率指标作为保险行业同业对标体系中的一个重要考核指标(也有企业将因子指标综合赔付率和综合费用率分别作为同业对标体系中的指标),对其展开深度

 

图7 综合成本率指标分解模型

分析,提高企业核心竞争力具有重要意义。通过该指标和同业企业进行对标时就有了针对性的意义,当综合成本率过高时,我们可以对其相关因子指标一层层地做透析分析,找出引起指标变化的因子变量,首先分析综合赔付率和综合费用率两项指标的变化情况,同样的方法,层层分解直到找出引起指标变化的实际业务数据,在实际业务中改善。

2.未雨绸缪,优化补强

企业在经营中往往会提前制定可行性的目标和实施方案,数据化预测模型则是企业在做可行性方案时的重要依据,模型一般需要具备可操作、可量化等特点,而且在实际过程中会针对不同的指标设置相应的阈值,实现过程监控和预警。

预测模型的实施有两个出发点:从管理角度提升综合竞争力和排名,同业对标的考核以得分为最终判断标准,根据指标权重和指标得分,为全面提高得分提升企业排名,以目标为导向有针对性地调整经营策略;从经营角度改善业务指标状况,业务指标值是企业得分计算的依据,以过程为导向有针对性地进行业务改善和加强。

如果整个企业的同业对标体系过于庞大,并且多数指标都有相应的分析模型,就需要使用专业的企业规划软件进行目标的设定和预算的编制,它可以很好地帮助我们分析数据和建立模型。

同业对标管理是现代企业众多量化管理模型中的一种,整篇文章简要地描述了企业实施同业对标管理时的主要步骤和一些相关的分析方法,希望通过本文可以给想要开展同业对标管理的企业提供参考。

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
1月前
|
Cloud Native 数据处理 云计算
探索云原生技术在大数据分析中的应用
随着云计算技术的不断发展,云原生架构作为一种全新的软件开发和部署模式,正逐渐引起企业的广泛关注。本文将探讨云原生技术在大数据分析领域的应用,介绍其优势与挑战,并探讨如何利用云原生技术提升大数据分析的效率和可靠性。
|
11天前
|
分布式计算 Hadoop 大数据
大数据技术与Python:结合Spark和Hadoop进行分布式计算
【4月更文挑战第12天】本文介绍了大数据技术及其4V特性,阐述了Hadoop和Spark在大数据处理中的作用。Hadoop提供分布式文件系统和MapReduce,Spark则为内存计算提供快速处理能力。通过Python结合Spark和Hadoop,可在分布式环境中进行数据处理和分析。文章详细讲解了如何配置Python环境、安装Spark和Hadoop,以及使用Python编写和提交代码到集群进行计算。掌握这些技能有助于应对大数据挑战。
|
9天前
|
数据采集 搜索推荐 大数据
大数据中的人为数据
【4月更文挑战第11天】人为数据,源于人类活动,如在线行为和社交互动,是大数据的关键部分,用于理解人类行为、预测趋势和策略制定。数据具多样性、实时性和动态性,广泛应用于市场营销和社交媒体分析。然而,数据真实性、用户隐私和处理复杂性构成挑战。解决策略包括数据质量控制、采用先进技术、强化数据安全和培养专业人才,以充分发挥其潜力。
13 3
|
11天前
|
运维 供应链 大数据
数据之势丨从“看数”到“用数”,百年制造企业用大数据实现“降本增效”
目前,松下中国旗下的64家法人公司已经有21家加入了新的IT架构中,为松下集团在中国及东北亚地区节约了超过30%的总成本,减少了近50%的交付时间,同时,大幅降低了系统的故障率。
|
21天前
|
NoSQL 大数据 数据挖掘
现代数据库技术与大数据应用
随着信息时代的到来,数据量呈指数级增长,对数据库技术提出了前所未有的挑战。本文将介绍现代数据库技术在处理大数据应用中的重要性,并探讨了一些流行的数据库解决方案及其在实际应用中的优势。
|
26天前
|
机器学习/深度学习 人工智能 数据可视化
基于Python的数据可视化技术在大数据分析中的应用
传统的大数据分析往往注重数据处理和计算,然而数据可视化作为一种重要的技术手段,在大数据分析中扮演着至关重要的角色。本文将介绍如何利用Python语言中丰富的数据可视化工具,结合大数据分析,实现更直观、高效的数据展示与分析。
|
1月前
|
存储 NoSQL 大数据
新型数据库技术在大数据分析中的应用与优势探究
随着大数据时代的到来,传统数据库技术已经无法满足海量数据处理的需求。本文将探讨新型数据库技术在大数据分析中的应用情况及其所带来的优势,为读者解析数据库领域的最新发展趋势。
|
1月前
|
存储 分布式计算 大数据
现代化数据库技术——面向大数据的分布式存储系统
传统的关系型数据库在面对大规模数据处理时遇到了诸多挑战,而面向大数据的分布式存储系统应运而生。本文将深入探讨现代化数据库技术中的分布式存储系统,包括其优势、工作原理以及在大数据领域的应用。
|
1月前
|
分布式计算 DataWorks 关系型数据库
DataWorks报错问题之dataworks同步rds数据到maxcompute时报错如何解决
DataWorks是阿里云提供的一站式大数据开发与管理平台,支持数据集成、数据开发、数据治理等功能;在本汇总中,我们梳理了DataWorks产品在使用过程中经常遇到的问题及解答,以助用户在数据处理和分析工作中提高效率,降低难度。
|
1月前
|
大数据 Java Go
Go语言在大数据处理中的核心技术与工具
【2月更文挑战第22天】本文深入探讨了Go语言在大数据处理领域的核心技术与工具。通过分析Go语言的并发编程模型、内存管理、标准库以及第三方工具库等方面,展现了其在大数据处理中的优势和实际应用。同时,本文也讨论了如何使用这些技术与工具构建高效、稳定的大数据处理系统,为开发者提供了有价值的参考。