数据创新的四个陷阱

本文涉及的产品
智能数据建设与治理Dataphin,200数据处理单元
数据可视化DataV,5个大屏 1个月
可视分析地图(DataV-Atlas),3 个项目,100M 存储空间
简介: 数据的重要性在当今已经无需在多言,所有的企业都意识到数据的重要性,都希望利用数据来驱动业务的发展。但是,很多企业信息化管理者依然存在对于数据智能,数据驱动的一些误解,这些误解会让企业的数据利用陷入深渊。


-更多关于数智化转型、数据中台内容请加入阿里云数据中台交流群—数智俱乐部 和关注官方微信公总号(文末扫描二维码或点此加入

-阿里云数据中台官网 https://dp.alibaba.com/index

作者:智询

数据的重要性在当今已经无需在多言,所有的企业都意识到数据的重要性,都希望利用数据来驱动业务的发展。

但是,很多企业信息化管理者依然存在对于数据智能,数据驱动的一些误解,这些误解会让企业的数据利用陷入深渊。

陷阱一、应用尚未建设,所以不考虑数据利用

当我们跟一些企业信息化管理者聊起应该尽早的考虑数据的利用,要对数据做整体规划时,会经常听到这样一句话。

“我现在业务都还没做起来,还不到考虑数据利用的时候”

这一句话代表了很大一部分企业对于数据利用的认知,那就是,数据利用是从先有数据开始的,而数据是在应用建设之后存到数据库里的,所以先建设应用,然后等数据库里有了数据后,在考虑如何利用数据。

听上去,这个逻辑完全正确。

但是其实这就是很多企业存在的首要的对于数据利用的误区:”先建设应用,再考虑数据利用“。

如果用这样的思路去建设,过了一年以后,往往这个企业就会立刻提出新的问题,“多个应用系统之间的数据不打通,不对齐,不一致,数据用不起来”。

这个误解,是根本上不充分理解数据利用的两个本质:

第一,数据是客观存在的,不取决于你建不建设应用
一个企业,只要业务在运行,哪怕它没有建设任何系统,它的数据都是在实时产生的,只是你没有把它采集起来而已。

数据是业务在数字化世界里的构成原子,业务流程和行为会时刻产生各种数据,而不是必须要建设应用这些数据才产生的。举个例子,当快递员接到一个快递订单的时候,发件人,收件人,货物类别,发货地,发货地,运输工具类型,距离等这些数据就已经产生,并且会驱动这个快递的走向。有没有信息化系统的支持,只是改变了这些数据的记录和传递的手段是一张纸还是一个网络而已。这些数据是客观存在的,他不会因为信息化系统本身而改变。

我们要从本质上认知到,数据是业务在数字化世界里的投影模型,它是业务的镜像,是客观存在的。

只要有业务,那么就存在对应的数据。应用只是把数据通过软件采集到存储设备里而已。

第二,数据利用的规划要早于应用和流程的建设
我们在建房子之前,就要做整体设计,规划出一栋大厦的各种利用场景,只有这样才不会出现一个不能被进入的房子。

现在,每个企业都意识到,数据是企业的核心资产,应用是采集和利用这些资产的工具。为了更好的在数据采集之后得到充分的利用,每个企业必须要在应用和流程的规划之前,完成数据利用的规划。

这就包括企业的数据资产目录的规划设计,企业的数据利用场景的规划和数据的存储,处理分析这些数据的技术平台的需求规划等。

Data First,在系统还没有建设的时候,做好了数据的蓝图规划,完成了各个应用系统的数据分布全景图,企业就能规避数据孤岛的存在。

所以,如果你现在还没有建设应用,那么恭喜你,这是最好的规划数据利用蓝图的机会,赶紧开始吧。

陷阱二、没有大数据,所以就不考虑数据利用

“我们现在的数据很少,只能叫小数据,所以还谈不上数据利用”,这也是一个典型的数据利用的误解。

我第一次听到这句话就是在B2B2C的零售企业。的确,传统的通过经销商为主要渠道的品牌商,往往没有建立自己的电商体系,所以最终消费者的行为数据拿不到。他们有的就是Sell In的数据,而Sell In的数据往往量不大,并且维度不多,所以利用价值有限。

但是,现在的这个企业正在做的事情就是通过一个个的小程序,小应用,建立各种和终端消费者,客户的触点,从而获取各类数据,单个的看都是小数据,量不大,维度也不多,但是,当这所有的点连接在一起,就构成了一个丰富,多样的用户数据全景。

这个企业的业务负责人笃信,在数字化时代,谁拥有更多的数据场景,谁就能够拥有更强的竞争优势。

这个事例充分的说明,也许现在你的业务模式决定了你并没有丰富的数据,但是,你依然要通过各种应用创新来多渠道,全方位获取用户,消费者的数据。而要建设什么应用,获取什么数据,获取的这些单个点状数据间如何构成相互联结,组合出数据场景价值呢?

这就是需要在构建应用之前有数据规划,勾勒出一个数据场景地图,从而沿着这个地图去建设个中小应用。

陷阱三、数据利用就是做数据分析和挖掘,交易应用系统就用不到数据技术

过去的应用系统被划分为OLTP和OLAP,在线交易型系统和在线分析型系统。所以,往往一看到这个应用本身是一个交易型的软件,按照传统的架构,那就是OLTP系统,所以往往不会用到一些OLAP的技术。

但是,目前的情况则发生了巨大的变化。

拿约车调度系统来讲,按照传统的划分,这是典型的交易系统,创建订单,分配司机。但是,如果要能够支撑每秒几万单的调度分配,用手工分配的方式是不可能的,这个调度系统需要具有实时数据分析能力,而这里面价格确定和路线的规划的部分,又需要参考历史的相关数据分析结果。这样一来,这个典型的交易应用是被数据驱动的,它的底层和和核心其实是批量数据分析和实时数据处理。

未来的所有的应用都会是这样,那就是OLAP在支撑着OLTP系统的每一个决策和行为,从而成为智能的应用。

数据技术正在逐渐重构所有的传统流程类应用,让他们成为数据驱动的系统,从而变得更智慧。

陷阱四、最重要的是算法,所以软件工程公司是做不了数据科学项目的

一提到数据项目,很多人脑子里第一个想到的就是算法模型,似乎只有做研究的,做算法的,做人工智能的才是做数据的。

所以,现在有一类观点,认为信息化产业里分为做算法的和做软件的,而只有做算法的才是做人工智能和数据的。

这是一个典型的误解,将算法与软件工程割裂开来。就像不久前,一个长期合作的客户用一个固有印象,”思特沃克不是做人工智能的“,就否定了我们的一个机会,这就是对于人工智能应用的误解。

我们用下面这张图来体现算法和人工智能(数据科学)的关系。
1CF104DC-AEF5-49CF-AC78-6EC7D14E61B3.png

人工智能的最底层是由各种算法组成的,但是,目前行业里所有人使用的常用算法,都是公开的,而真正研究和产出这些算法的,是学术研究机构。

人工智能分为两个领域,一个是前沿研究领域,一个是应用领域。而作为从事工业生产和商业运营的企业来说,需要的是后者。而后者最重要的是利用软件工程能力将适合的算法应用到有价值的场景,从而去赋能业务。

在算法之上,人工智能的应用更重要的是充分的高质量的数据集,将算法和数据开发成为良好用户体验的智能软件的工程能力。

所以,优秀的做人工智能的企业除了拥有调优,调用公开的算法和代码之外的能力更重要的是业务创新和软件工程的能力。

总结和启示

通过逐个分析这四个对于数据智能的四个陷阱,我们可以得出如下启示:

   ** 一、数据规划应该优先于业务系统的建设,构建拉通的,一致的数据全景图,避免应用之间的数据孤岛

    二、构建起数据全景图后,在沿着这个地图来构建一个个去采集填满这些数据的小应用,从而构建自己的数据资产

    三、所有的应用软件都会被数据技术所赋能,成为数据驱动的智能应用

    四、人工智能应用于业务最重要的是场景创新能力和软件工程能力**


数据中台是企业数智化的必经之路,阿里巴巴认为数据中台是集方法论、工具、组织于一体的,“快”、“准”、“全”、“统”、“通”的智能大数据体系。

目前正通过阿里云对外输出系列解决方案,包括通用数据中台解决方案零售数据中台解决方案金融数据中台解决方案互联网数据中台解决方案政务数据中台解决方案等细分场景。

其中阿里云数据中台产品矩阵是以Dataphin为基座,以Quick系列为业务场景化切入,包括:

官方站点:
数据中台官网 https://dp.alibaba.com
钉钉沟通群和微信公众号
数据中台钉钉群二维码2.jpg

相关实践学习
阿里云百炼xAnalyticDB PostgreSQL构建AIGC应用
通过该实验体验在阿里云百炼中构建企业专属知识库构建及应用全流程。同时体验使用ADB-PG向量检索引擎提供专属安全存储,保障企业数据隐私安全。
AnalyticDB PostgreSQL 企业智能数据中台:一站式管理数据服务资产
企业在数据仓库之上可构建丰富的数据服务用以支持数据应用及业务场景;ADB PG推出全新企业智能数据平台,用以帮助用户一站式的管理企业数据服务资产,包括创建, 管理,探索, 监控等; 助力企业在现有平台之上快速构建起数据服务资产体系
相关文章
|
6月前
|
安全 数据库连接 PHP
PHP编程中的关键性技术探究
在当今信息化社会,PHP作为一种流行的服务器端脚本语言,已经被广泛应用于网站开发和动态网页生成等领域。本文将深入探讨PHP编程中的关键性技术,包括数据库连接、安全性防护、性能优化等方面,旨在帮助读者更好地理解和运用PHP语言。
|
6月前
|
人工智能 数据挖掘 程序员
代码力量:探寻编程在现代社会中的无限可能性
代码力量:探寻编程在现代社会中的无限可能性
|
3月前
|
安全 算法 数据安全/隐私保护
汇编语言在当代计算领域的重要性:深入探讨其持续价值与实际应用
【8月更文挑战第31天】汇编语言虽看似古老,但在当今计算领域仍具不可替代的价值,是计算机科学的基石和高性能应用的核心。本文通过游戏开发、安全加密及操作系统内核开发等案例,展示了汇编语言在性能优化、硬件交互与增强安全性方面的独特优势。尽管现代编程语言抽象层次更高,但掌握汇编语言对深入理解计算机工作原理和追求极致性能仍至关重要。
90 0
|
5月前
|
存储 人工智能 安全
数字化转型的10大陷阱及如何避免
数字化转型的10大陷阱及如何避免
|
人工智能 大数据 定位技术
数字化转型一个本质和两大误区
数字化转型一个本质和两大误区
187 0
阻碍你发展的是《能力陷阱》
读书的一大乐趣就是可以颠覆认知,让不同的思想在你这里汇聚,拓展你的思维,丰富你看问题的角度,让你在变化中成长。最近这本《能力陷阱》无疑是给我在认知上带来冲击很大的一本书,读完这本书,我自己也被惊出一身汗,这些陷阱真实存在,但自己却浑然不知。
3832 0
|
大数据 数据管理
大数据造成的陷阱 为什么小数据更重要?
“被过滤和忽视是小数据的命运,原因是人们没有现成的概念去定义和解释它们。可是,没有小数据,大数据管理会充满陷阱。小数据为主,大数据为仆,这是数据管理的正道。 ”
918 0