风剑分享“站在上帝视角看数据”,点燃企业大数据梦想与思潮

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: “2018年,在人工智能、区块链等概念的花式风口与泡沫之下,企业服务领域反以其针对B端企业的重实用性与宽“护城河”,正有条不紊的发展着。云服务、企业OA、协同SaaS产品、大数据服务等各种兼具敏捷性与实用性的产品层出不穷,企服产品的提效应用让许多企业摆脱了冗杂的工作流程,提升了业务效率,涌现而出的商业机会则成为了新经济突破口。

“2018年,在人工智能、区块链等概念的花式风口与泡沫之下,企业服务领域反以其针对B端企业的重实用性与宽“护城河”,正有条不紊的发展着。云服务、企业OA、协同SaaS产品、大数据服务等各种兼具敏捷性与实用性的产品层出不穷,企服产品的提效应用让许多企业摆脱了冗杂的工作流程,提升了业务效率,涌现而出的商业机会则成为了新经济突破口。”

在数据化时代,企业用户如何用好大数据、赋能企业自身,具有十分重要的战略意义。因此,数澜科技CEO风剑在3月16日中国企业服务大会 - 西安站中,结合自身近10年的大数据从业经验,提炼企业数据化方法论,向现场观众分享了一场关于《数据掘金,赋能企业级用户》的主题演讲,从上帝视角深入浅出看懂大数据,具体全文摘录如下:

企业服务虽然近一两年在国内增长特别快速,但跟国际发展比起来还是相差的较为遥远。去年美国的企业服务市场占比60%以上,国内只占7%,因此中国的企业服务市场空间巨大。

在大数据行业内,很多企业会通过搜集大量数据来做数据产品进而服务各个行业,导致早期国内大数据公司都倾向于”拿”数据。近两年云服务企业高速发展之后,我认为在大数据领域更重要的事情变成了如何帮助企业把自身数据变成一种价值、一种未来,企业最重要的事应该是:把数据真正用起来。

一、大数据的未来不是时光机

在未来5年内,无论是面向企业还是政府,在大数据方向上都会有一个特别重要的契机:怎么帮助政府和企业把自身的数据用起来?当前的时间节点就是最好的,因为只有把自身数据用起来,才有可能把企业外部的数据用起来。

我们总结大数据领域有三大核心理论,第一条理论是数据的连接。在国内错综复杂的环境内,企业和政府的系统环境越来越多元化,尤其是大型企业少则十几套系统,多则几十套、上百套系统,不同的系统开发商提供的数据也是千奇百怪。所以数据的连接变得特别关键,例如一个政府里有很多职能部门,部门之间的数据连接就变得很重要。我们认为这是让数据产生价值的第一要点,谁拥有能把数据连接起来的能力,谁就有把数据能力最大化的可能。

在数据连接方法论的基础上,我们推崇人、物、场景的连接。基于此,能够让大数据发挥价值的核心关键点在于:场景化,这也是数澜第二条大数据核心理念。

比如今天大家在一起聊天,这是一个场景—“在一个时空维度上,聊企业服务、数据怎么用。”因为有这个场景的存在,把我们所有的领导和同行连接起来,这个连接可能是人与人之间的,也可能是人与物之间的,甚至是物与物之间的连接关系。

我们把这种连接方式称之为“基于场景的连接”。在大数据领域还有一种误区:提起大数据很多人会想到“时光机”,把过去成长的信息用生动、形象、感性的词语加可视化数字表达出来。制作时光机时,可以将所有机器记录的数据拉出来,包括跟谁聊天、什么时候发生交易等数据,再对时间序列数据抽取排列,这样每一个人的行为就都刻画在历史时空的维度上,每个人虽然行为复杂但同时也可视清晰,这种数据应用就叫做时光机。

但大数据的未来不是时光机,时光机是传统IT方式的延伸,它只是对过去事物的描述,并不算真正的大数据。我们认为真正的大数据应该是“时光倒流”,让我们可以经过很多年后回到过去的某一场景来推演预测,或规划未来。这种理论特别神奇,举例来说:若干年后回顾今天,如果来参会的企业中没有数澜科技,那对数澜科技的发展会有怎么样的影响?这种思维方式叫时光倒流,在公检法领域中可广泛应用“时光倒流”理论,尤其根据线索破案。例如找不到案件突破口而陷入迷茫时,可以通过时光倒流技术不断的把角色做替换、把时空做替换,不断的迭代;把时间、地点移动推导发展的时间序,当这个时间序不能够延续下去的时候,我们认为这就是案件最佳可疑点。

其他大量场景也都可以借用“时光倒流”理论,将过往发生记录过的所有信息全面连接起来,去假设你的未来。

这种连接方式很奇怪,是旧时空维度上的连接,也许是你和你的同事、你的朋友、你的兄弟,也许是某一件事物或者某一个场所,我们认为这种方式使连接产生巨大价值。

二、违背了不确定性,大数据的价值就永远归于零

第三条理论是:数据最大的魅力在于不确定性。大家都喜欢假设我的数据特别有价值,经常会用来做数据分析或者预测,但不管什么样的模型和技术,如果违背了不确定性,它的价值就永远归于零。

举一个例子,很多人会把双色球的数据存下来做预测。然而双色球每一期开奖完全随机,过往价值永远是零。我们仍然有很多数据同行会对双色球数据做分析和预测,比如1号球在过去的三十二年从没有出现过,那么它再出现的可能性极高或极低?听起来似乎都有一定的道理。但是如果不作弊,那1号球永远只有三十二分之一出现的几率,这是概率论的基本法则。如果说已经确定了发生概率的事件,就不需要用大数据去做了。它违背了不确定性的方法论,大数据一定是不确定的。

再比如业界很火的量化投资,我也曾经做过相关模型分析,发现量化投资是一个伪命题,因为这个场景内有一个基础前提:资金总量不变,量化模型形成产品面向社会公众的时候就变成一种坑人模式,谁吃亏,谁来赚,量化投资模型会发生根本性的变化;在资金总量不变的情况下,所有股票有涨自然有跌。

什么样的场景是有价值的呢?就是不确定性的场景。比如流行颜色的预测,是全社会贡献的数据,一个人不能左右潮流,当很多人慢慢喜欢这种颜色的时候就变成了趋势。我们人类也许不知道,但数据能够实时知道增长的速度,在2019年哪种T恤是流行的。

所以不确定性的场景才有大数据解的价值。

三、大数据的上帝理论

另外还有一个常见的误区,即很多人觉得做数据产品必须以某一个角色去理解研究数据,这就违背了“大数据的上帝视角理论”。无论政府还是企业,数据永远会站在上帝视角来看问题。很多人会陷入自身的角色中看问题,做产品觉得自己必须替入某一个角色去研究而抽象不出。处理商务、客服问题都可以设身处地,但是处理数据不可以,因为数据是至上的,不要用你局限的眼光去左右数据的走向。当你把自己变成某一个角色的时候,你已经不知道全局的走向是什么所有角色的想法是什么了。几个人在前面走着,我永远不知道后面这个人对我有没有威胁,但如果站在上帝的视角去看数据的蛛丝马迹,就会知道这个人有嫌疑,嫌疑度有多少。做大数据应用的时候,天生就是上帝视角,数据产品绝对不能站在某一个视角看全局,这样出来的产品就会片面和糟糕。

所以数澜在做数据产品的时候都会遵循上帝理论,从全局看一个点,看一个人的身体状况,也可以看未来趋势。但是你不能站在某一个角度看我,要站在上帝的视角,大数据赋予了你能从上帝视角查看问题的能力和高度。所以要解不确定性场景问题需要非常多的”东西”来支撑,这样的”东西”也许业界当前还没有,但是我们正在努力尝试,数澜在做大数据解决方案的时候会认真观察什么样的场景下,什么样的方法适用于什么样的企业。同时也会自我告诫自我冷静,另一面的世界我们并不清晰了解,这样的场景不能碰,数据无能为力。

前不久我们为某城市做了一个基于大数据分析挖掘固定资产异动原因的项目:城市固定资产为什么会异动?异动的原因有哪些?异动的区间在哪里?什么时候会反弹?政府决策者特别希望利用数据找到答案(大数据上帝视角),不能一直异动,否则企业怎么办?老百姓怎么办?政府怎么办?数澜用大数据技术连接固定资产信息、投资记录等各方面数据,研究分析后告诉政府区间在哪里,原因在哪里,在已知为何异动后,应该采取什么样的对策,可以极大的缩短异动区间,预测反弹节点。这些问题都是因为我们不确定而提出的,因为不确定,所以我们用数据做相应的支撑。

四、数据业务化和数据资产化是巨大的机会

数据本身的价值。很多人喜欢讲数据价值多喜欢讲场景化应用/数据产品。但数据的产生、加工、应用等每一个环节的价值都是巨大的,只有把数据生命周期各阶段都研究透彻,我们在做数据产品的时候才会变得得心应手。数澜的数栖平台一直围绕这三大方法论做相应研发和演进。我们有一家非常重要的合作伙伴,是国内知名的B2B原材料采购平台,他们有非常强烈的诉求,希望能解决原材料采购之间的上下游信任问题,依靠平台本身的能力,怎么做到上游是可靠的,下游又有哪些?数澜通过数据的整合,把他的上、下游企业串联之后通过关系网络+信用风控推荐值得信任的合作企业,类似的案例还有很多。

政府和企业做数据的切入点也非常重要,方向一定是从内往外的。过往传统的从外向内式的服务方式也许不到三年就会慢慢被淘汰。

对于政府和企业来说,当前有两个阶段存在巨大的机会,分别是政企数据资产化和政企数据业务化

【现场问答整理】

问:我们都知道和发达国家的企业服务领域相比,中国的企业服务发展是多个领域同步前进,那么日后的发展会怎样?

答:今天中国90%的初创企业基本都在做To C,因为To C太容易成长为独角兽了,相比之下,国内To B的市场刚刚起步。

数澜成立的时候有特别大的梦想,要在企业大数据领域抢一个位置。To C做到最后都要站队,谁有流量谁就胜出,但是To B不一样,即使是亲兄弟,如果你的产品不能为企业带来价值,那它也绝对不会用。因为不好的产品会给企业效率带来影响,所以To B特别现实,你的产品能给我带来价值,我就使用你的产品,这种价值就会带来很强的黏性。

数澜科技本身成长特别快,2016年6月份成立,到现在完成了多轮融资,投资我们的机构都是国际顶级的VC。但数澜哪怕到今天都还是处于刚刚会爬的阶段,我们每次跟客户讲,我们是初创的企业,希望公司先花5年时间活下来,活下来就有机会。再花5到10年的时间在这个领域建立自己的行业壁垒和标杆,这是数澜的整体的计划,当然还有我们自己的大梦想。

问:大数据仍然是今年的大风口,一些大的公司拥有海量的数据,也有更加丰富的大数据处理经验,以及足够有说服力的产品,如果这些企业进入的话,对于数澜科技会有多大影响呢?

答:第一点,很多场景下,对企业自身来说,对外面的数据诉求远远没有大家想象那么大。尤其是传统型企业,比如原料采购、生产制造、过程控制、品质检验等全流程走下来,对外面的数据没有太多诉求,把自己的数据用好就已经很有价值了,BAT数据的价值虽然是巨大的,但目前对我们的压力没有那么大。我们从服务传统企业开始,一个传统企业动辄上百亿、上千亿的成本预算,如果能够帮助他们提升一点点效率,那提升效率节省下来的钱就足够支付你的服务。我有句话叫“走自己的路,看都不要看别人”,我们不要看别人,我们不想看别人,当你看别人的时候就会觉得压力特别巨大,当你发现别人钱比你多,技术比你好,什么都比你强的时候,你会彻底崩溃,当前我们发现竞争没有那么大。

第二点,我们在平台方面,走自己坚定不移的那条路,技术方面的创新是所有进步的根源和核心动力。数澜对平台的投入特别巨大,数栖平台的打造搭建前后花了18个月的时间,公司基本全部技术力量都投入到了平台建设中。很多人觉得创业公司做平台一定会死,我跟他们说那也不一定。所以这里面取决于我们自己想要什么、值得舍去什么。我们愿意直面竞争,不打价格战,在几次招投标终轮PK的时候,我们都没有在价格上做妥协,输就输,但要坚守自己该有的信念和原则。

当然第二点指的并不是说一定要走差异化路线,而是要明白和坚定不移的走自己认定的那条路。因为企业服务太广泛了,就像BAT服务了很多互联网公司,企业服务也有自己的各条路可以走。我喜欢讲一句话:一个宁波市年产值过亿的企业客户就有几千家,如果我们利用大数据为客户创造足够多的价值,客单价可以做到几百万,而这种公司将传统领域结合大数据转型赋能可以做的特别好,市场也足够大,我们应运推出,这个时机刚刚好。

行走在创业路上,越往前走路就越来越多了,这就是一个过程。在这条路上不要忘记原本的初心,这条路的起点、沿途所见的风景和想要的梦想,一个都不要忘记。对于很多创业者来说,在把自己和他人对比的过程中,可能会丧失自己原来的想法,这让人理解但同时也非常可惜,坚持做自己是最重要的。

以上内容为风剑现场演讲实录,希望对大家能够有所帮助,并持续的关注我们!

关于数澜科技

数澜科技是一家专注于企业数据资产化及应用增值的专业大数据服务公司,致力于将领先的大数据理念和实践经验传递给各领域企业和政府客户,帮助企业和政府将数据转化成生产资料,并借助云计算和算法赋能,最终实现企业生产力和政府治理能力的快速提升。自2016年6月成立至今,数澜团队践行大数据“连接”、“不确定性”和“场景化”的三大核心理念,目前已为近超过1000家企业和政府用户提供大数据相关服务,旗下核心产品数栖平台作为国内领先的一站式大数据资产化及应用平台,助力地产、零售、政企、金融、汽车等多领域客户取得卓越的数据业务效果。秉承着“致力于企业数据资产化及应用增值”,共建大数据生态服务的愿景,数澜科技将坚持与各数据消费方、数据开发方和数据提供方等专业生态伙伴共同携手,共迎大数据应用的美好未来。

关于风剑

甘云锋(风剑),中国国籍,数澜科技创始人、董事长兼CEO。曾在华为、金蝶、阿里巴巴担任过数据架构师、数据科学家、数据业务负责人等职位。2012年即开始负责创建阿里集团最核心的数据互联技术(ID-MAPPING)、数据资产体系(TCIF)、数据价值营销系统(DMP)、城市智慧大脑(AI项目)等;沉淀国际领先的大数据思想及前沿技术研究,奠定大数据应用建设的基础理论构架,并在此基础上构建了国内首个较为系统全面的大数据应用平台; 2015年即作为国内首批将大数据理念思想及大数据技术能力灵活应用到各专业领域特别是传统行业的大数据应用实践者,获得超过20多个行业领域客户及资本市场的认可和青睐。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
1月前
|
存储 分布式计算 数据挖掘
数据架构 ODPS 是什么?
数据架构 ODPS 是什么?
361 7
|
1月前
|
存储 分布式计算 大数据
大数据 优化数据读取
【11月更文挑战第4天】
53 2
|
1月前
|
数据采集 监控 数据管理
数据治理之道:大数据平台的搭建与数据质量管理
【10月更文挑战第26天】随着信息技术的发展,数据成为企业核心资源。本文探讨大数据平台的搭建与数据质量管理,包括选择合适架构、数据处理与分析能力、数据质量标准与监控机制、数据清洗与校验及元数据管理,为企业数据治理提供参考。
90 1
|
1月前
|
机器学习/深度学习 存储 大数据
在大数据时代,高维数据处理成为难题,主成分分析(PCA)作为一种有效的数据降维技术,通过线性变换将数据投影到新的坐标系
在大数据时代,高维数据处理成为难题,主成分分析(PCA)作为一种有效的数据降维技术,通过线性变换将数据投影到新的坐标系,保留最大方差信息,实现数据压缩、去噪及可视化。本文详解PCA原理、步骤及其Python实现,探讨其在图像压缩、特征提取等领域的应用,并指出使用时的注意事项,旨在帮助读者掌握这一强大工具。
72 4
|
1月前
|
存储 大数据 数据管理
大数据分区简化数据维护
大数据分区简化数据维护
25 4
|
1月前
|
存储 大数据 定位技术
大数据 数据索引技术
【10月更文挑战第26天】
60 3
|
1月前
|
存储 大数据 OLAP
大数据数据分区技术
【10月更文挑战第26天】
71 2
|
1月前
|
消息中间件 分布式计算 大数据
数据为王:大数据处理与分析技术在企业决策中的力量
【10月更文挑战第29天】在信息爆炸的时代,大数据处理与分析技术为企业提供了前所未有的洞察力和决策支持。本文探讨了大数据技术在企业决策中的重要性和实际应用,包括数据的力量、实时分析、数据驱动的决策以及数据安全与隐私保护。通过这些技术,企业能够从海量数据中提取有价值的信息,预测市场趋势,优化业务流程,从而在竞争中占据优势。
118 2
|
1月前
|
数据采集 分布式计算 大数据
数据治理之道:大数据平台的搭建与数据质量管理
【10月更文挑战第27天】在数字化时代,数据治理对于确保数据资产的保值增值至关重要。本文探讨了大数据平台的搭建和数据质量管理的重要性及实践方法。大数据平台应包括数据存储、处理、分析和展示等功能,常用工具如Hadoop、Apache Spark和Flink。数据质量管理则涉及数据的准确性、一致性和完整性,通过建立数据质量评估和监控体系,确保数据分析结果的可靠性。企业应设立数据治理委员会,投资相关工具和技术,提升数据治理的效率和效果。
118 2
|
1月前
|
存储 安全 大数据
大数据隐私保护:用户数据的安全之道
【10月更文挑战第31天】在大数据时代,数据的价值日益凸显,但用户隐私保护问题也愈发严峻。本文探讨了大数据隐私保护的重要性、面临的挑战及有效解决方案,旨在为企业和社会提供用户数据安全的指导。通过加强透明度、采用加密技术、实施数据最小化原则、加强访问控制、采用隐私保护技术和提升用户意识,共同推动大数据隐私保护的发展。