王叁寿:只有数据源服务商才有资格构建大数据生态圈

简介:
+关注继续查看

王叁寿认为,如同在大数据价值变现过程中,数据源始终占有绝对重心一样(王叁寿图),未来只有数据源服务商,才有资格构建大数据生态圈。

image

  数据源服务商产业链核心位置,无可替代

一个完整的大数据生态圈,由数据源、硬件支撑层、技术层、应用层、交易层、衍生层构成。大数据生态圈良性运转最重要的根源,来自行业起点——数据源。如果没有数据源公司对政府、行业、企业、互联网、物联网、移动通信以及第三方海量数据的挖掘处理,大数据硬件、软件生产和投入应用都无从谈起。

“发展大数据产业,首要解决的是促成数据资源的极大丰富和开放使用,这决定了数据源服务商在产业链条上应该始终处于核心位置。”九次方大数据创始人王叁寿表示。

image

就中国目前大数据行业发展现状而言,业内不无担忧。《2016年中国大数据交易白皮书》对产业生态进行了回顾和预测。白皮书显示,在2016年大数据产业整体规模超过2400亿元的盘子里,基础框架硬件创造的产值将达到1093亿元,几乎占据半壁江山,而大数据软件市场和大数据服务市场所创造的产值均未超过20亿。

“解读这一反差,会发现中国大数据产业存在的两个基本事实,一方面,产业整体处于发展的初期准备阶段,这为服务器、存储器等硬件制造商提供了绝好的市场机遇,而另一方面,存储器、服务器为处理海量数据而存在,没有可以匹配的数据资源,计算机硬件资源存在着极大浪费的潜在风险。”王叁寿说。

事实上,全球数据中心约有一千万台服务器被限闲置,占到市场规模的30%,几乎浪费了300亿美元规模的IT基础架构投资。王叁寿表示,这一现象在中国也很突出,很多人对大数据行业缺乏深入了解,在服务器和大数据之间划等号,其实硬件设备只是漫漫长路的第一步,不能代表产业全貌,更不能引领整个生态圈走向完善,随着生态圈日益健全,本末倒置的趋向会发生变化。

“数据源才是整个产业发展进步的核心。”王叁寿带领的九次方大数据就是在做一件释放数据价值的事情。虽然王叁寿称九次方大数据是“管道工”,但正是通过一条四通八达延伸到全国40余省市的数据管道,公司汇聚了更多数据资源,相互碰撞,实现了数据的价值。可以说,它更应该是一家数据源服务商。

数据源服务商掌握海量数据,处在大数据产业链上游,它的资源体量指导市场上硬件、软件的生产能力。麦肯锡全球研究院预测,2020年全球数据使用量将暴增44倍,达到35ZB,随着数据资源爆炸式地增长,硬件商、软件商的生产热情也将被带动起来。

良性运转的大数据生态圈依赖数据源服务商发挥中心作用,可以预见的未来,其他环节还将应市场趋势而动,不可避免地向中心靠拢:做服务器和底层系统的生产厂商将向大数据转型,提供低成本、低能耗的大型存储器;而软件生产商也将从卖软件转为以数据为中心。

白皮书肯定了这一趋势,显示我国大数据基础构架硬件市场规模将在2018年前后发生明显探底,而大数据软件市场、服务市场将逆袭向上。2016年至2021年,中国大数据服务市场年均复合增长率将超过硬件、软件市场,年均复合增速达到75%。

驱动生态圈完善,非数据源服务商莫属

王叁寿指出,数据源服务商通过对数据的挖掘处理,完成对整个生态圈发展基础的建构。这一基础的存在,驱动其他环节围绕着数据源做高效运转。

image

应处理海量数据的需求,硬件商将生产出采集、传输、存储等设备,软件商则通过设计研发数据采集、预处理、存储管理、分析挖掘、大数据可视化一系列软件,为数据源服务商服务。

王叁寿介绍,由于数据源服务商掌握了行业内最有价值的数据资源,即可以在硬件、软件的支持下,针对金融、医疗、农业、工业、能源、交通、物流、零售等多领域实际需求,设计出“接地气”的应用场景,服务于市场需求。同时凭借在市场行为中掌握的数据定价经验,以大数据租赁、基金、信托、期货、确权、托管等多种形式,实现大数据在更大范围内的流通。而再向外延伸,数据源服务商将产生更多诸如大数据培训、咨询、数据处理外包等增值服务。九次方大数据所做的事情就围绕着上述内容。

“数据源服务商通过这样一条路径,激活产业内每一个单一元素为数据价值变现服务,使大数据生态圈形成一个稳定高效的闭环。”王叁寿表示。

同时,解决目前现实中大数据行业存在的突出掣肘,离不开数据源公司发挥不可替代的作用。

政府、行业、企业、互联网、物联网、移动通信以及第三方数据,分别各自为政,掌握在繁多的行业、企业内部形成天然的壁垒,不实现对看似毫无关联的数据的挖掘采集清洗,使之产生碰撞并核裂变出全新价值,分散庞杂的数据虽多,却毫无意义。

王叁寿说:“数据源服务商存在的重要价值,在于其打破了数据之间相互割裂的孤岛状态和碎片化,实现数据聚合,建立起逻辑关联,为解决问题提供针对性参考指标。”

在数据安全方面,数据源服务商通过对海量数据进行清洗、脱敏,建模分析,去除掉原有数据所带有的隐私性属性,避免个人、企业信息泄露,从源头上消除安全隐患。

DT时代已经到来,有预测显示,2018年,大数据产业规模将接近6000亿元规模。王叁寿表示,随着产业政策环境一步步优化,未来大数据生态圈将越来越强调大数据与全产业链的结合,信息技术革新也将以前所未有的增速行进。在这个过程中,数据源服务商应该担负起构架良好大数据生态的历史使命,推动大数据更深层次、更广范围地为社会生产生活服务。“如同在大数据价值变现过程中,数据源始终占有绝对重心一样,数据源服务商,也只有数据源服务商,才有资格构建大数据生态圈。”

本文转自d1net(转载)

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
11天前
|
分布式计算 关系型数据库 分布式数据库
大数据Spark外部数据源
大数据Spark外部数据源
13 0
|
4月前
|
分布式计算 DataWorks 关系型数据库
带你读《全链路数据治理-全域数据集成》之24:3. 准备工作:添加数据源
带你读《全链路数据治理-全域数据集成》之24:3. 准备工作:添加数据源
|
4月前
|
分布式计算 关系型数据库 MySQL
带你读《全链路数据治理-全域数据集成》之34:3. 准备工作:添加数据源
带你读《全链路数据治理-全域数据集成》之34:3. 准备工作:添加数据源
|
9月前
|
存储 消息中间件 SQL
大数据繁荣生态圈组件之实时大数据Druid小传(二)Druid架构与原理
索引服务是数据摄入创建和销毁Segment的重要方式,Druid提供一组支持索引服务(Indexing Service)的组件,即Overlord和MiddleManager节点。
141 1
大数据繁荣生态圈组件之实时大数据Druid小传(二)Druid架构与原理
|
9月前
|
SQL 存储 分布式计算
大数据繁荣生态圈组件之实时大数据Druid小传(一)
根据上面的总结,随着每日增量数据的累加,短期来看mysql数据库是能够承载一定程度的数据量的,但是长期来看,mysql数据库将不堪重负。因此,我们需要寻找mysql数据库的替代方案,这里我们选择了apache druid实时数据库。
186 1
大数据繁荣生态圈组件之实时大数据Druid小传(一)
|
11月前
|
XML 分布式计算 大数据
Scala 学习 进击大数据Spark生态圈
Scala 学习 进击大数据Spark生态圈
|
SQL 分布式计算 DataWorks
QuickBI关于业务分析人员连接MaxCompute数据源权限控制问题解决方案及常见报错解析
企业上云,maxcompute数仓结合quickbi智能报表的组合较为常见,使用广泛。maxcompute权限管理较为精细化,部分权限缺失常常导致bi端相关数据应用报错,权限过高又会有潜在的风险暴露。本文针对上述问题提出相关的解决方案及常见的报错解析,当前方案已得到较多的应用。
|
SQL 消息中间件 存储
大数据生态圈常用组件(二):概括介绍、功能特性、适用场景
大数据生态圈常用组件(二):概括介绍、功能特性、适用场景
|
存储 SQL 分布式计算
MaxCompute 异构数据源与非结构化数据处理 | 学习笔记
快速学习 MaxCompute 异构数据源与非结构化数据处理
199 0
MaxCompute  异构数据源与非结构化数据处理 | 学习笔记
|
分布式计算 MaxCompute Java
Tableau 2019.4 发布,官方支持阿里云 MaxCompute 数据源,快来一起体验啦!
Tableau 是一款被广泛应用的商业智能分析工具,专注于为客户提供大规模分析所需的自主性和灵活性,无论客户在哪儿,数据驻留在何处,都是如此。如今,越来越多的客户选择在云端部署 Tableau。正因如此,在最新惊艳面世的2019.4版本中,Tableau与阿里云密切合作,重磅发布了针对阿里云的连接功能,使客户尽可能高效地连接到他们所需的全部数据。
5409 0
Tableau 2019.4 发布,官方支持阿里云 MaxCompute 数据源,快来一起体验啦!
推荐文章
更多