数据资源平台,驱动智能未来

简介: 目前,智能之路已经从钢筋混凝土的城市通向了遥远的边区,在这个智能化的过程中,究竟存在着哪些阻碍?阿里的机器智能首席科学家——闵万里将带领大家一同了解各类数据产品,并剖析各个大脑背后的运作机制。
回溯到两年多以前,在“我是歌手”的舞台上,阿里的AR开启了走出阿里巴巴集团、走向产业化的道路。同时随之而来的是一个问题——阿里的智能究竟该怎么做?大家可能已经从屏幕上看到了答案,那就是两个字——大脑。
从城市大脑、工业大脑、环境大脑、航空大脑,到刚刚胡总裁演示的农业大脑,智能之梦已经从钢筋水泥的超大型城市走向了遥远的边区、走到了农村的土地上。在梦中,每一寸土地的价值都能使用数字化手段进行量化。在这个数字化和智能化的过程中,阿里起到的作用不仅仅是帮助用户上云,更重要的是帮助用户了解上云之后应该干什么,在云上发生了什么。如果客户的数据仅仅是在云上存储,那么这离智能化还远远不够。今天将带领大家来透视一下“大脑究竟是如何炼成的”。
45841ee73eca989823b0745b1f0174ece0d84b40
在各个大脑的背后,必然有很多的工程师在默默地工作着,他们都秉承着一个理念——知行合一。阿里的目标不仅仅是让每一个企业主、每一个工程师、每一个养殖专家做到知行合一,更希望让城市里的每一个信号灯、每一个地铁售票机也做到知行合一。中国有句古话:亡羊补牢,未为晚矣。但是在高度节奏化、碎片化的现代化社会,亡羊补牢所带来的后果是大家所不能接受的,我们更需要在亡羊之前就进行补牢,因为任何的等待都需要消耗时间成本和未来的机会成本,任何一个滞后的响应都可能对企业造成不可挽回的损失。
在刚刚的闪电立方的介绍中,分享人演示了一个pb级别的数据如何快速地上云,在上云之后,如何由大脑进行承接,使其做到知行合一。但是在知行合一的背后,有一个共性始终贯穿于三个产业线之中,这个共性就是数据产品。假设客户拥有着一个pb级别的数据,包含了所有相关生产数据,如果这些数据仅仅是被记录下来作为事故发生后的追查材料,那么这些数据包含的价值并没有得到真正地释放。数据蕴含的真正价值极其庞大,正如下图中所说的那样,数据将是驱动智能未来的新能源。
e8ccdee318bc6bf4dcef944c9fdd5a1f1d8810f9
在历史的长河中,古罗马拥有众多城市,堪称世界之都,但是随着时间的流逝,现在它留给我们的只剩下无穷的念想,其价值没有经受住历史传承的考验,因为它没有将数据传承下来。到了18世纪初,Bernoulli家族意识到了这个问题,其中的一位杰出数学家更是大胆地进行预判,未来的社会必然会被海量的数据所淹没,并提出了一个著名的定理——大数定理。今天人们所说的大数据,在某种程度上都源自于这个公式。到了1948年,Shannon基于前人的研究创建了信息论,并提出了熵的概念。然后在1973年,日本的一位著名的统计学家Akaike提出了AIC信息准则,创建了用于从海量的数据中提取最有价值信息的模型,如果没有这个模型,我们现在将被pb、tb级别的数据所淹没。
在处理pb、tb等高级别的实时数据时,如何将数学理论和云计算能力相结合,创造无以计算的价值,是一个难以解决的问题。首先肯定不能像“小作坊”一样的去寻找数据,而是需要创建一条现代化的生产线,因为仅凭手工作坊是无法修建出通向未来之路的。在各个大脑的背后,有一套面向主体的数据操作系统,用于对数据进行处理。人们常说,数据是一种新能源。事实上也确实如此,数据实际上是一种高度可再生的资源,它不像撒哈拉沙漠中的石油,用一点少一点,数据每天都在产生,其价值瞬时即逝,所以数据是一种高度可再生的、价值及其稀薄的资源。因此想要从数据中提取价值,需要无与伦比的计算能力和计算方法。
数据增殖反应堆就是为了解决上述问题而提出来的。提到反应堆,人们首先想到的是核电站的反应堆,其输入是原材料,最后的输出是电力。同样的道理,数据增殖反应堆也能够提升数据的价值密度和价值效率。因为有产品,用户可以深度挖掘数据的价值,出现了隔代遗传和代代相传的现象;因为有产品,挖掘使用、在线调用的速度得到了极大提升,最终使得数据的价值密度增殖十倍,价值效率提升一百倍。
数据平台的核心能力体现在以下几个方面。一、它是全球首例城市五维实时数据融合;二、城市数据治理成熟七度模型;三、六大知识领域图谱;四、运行时做到零脏数据。
a7c53fb878a3ba5210ff410a827cad53e452b39f
在这个平台上阿里提出了数据DNA的概念。当公共数据被看做为一个生命体时,其彼此间的逻辑结构便可以被看做是化学链接。如果在上层的应用出现异常,平台能够精准的追溯到出问题的数据源。目前已经实现了数据资源平台的响应时间小于1s,无论是城市大脑、农业大脑,还是工业生产线的大脑,当上层应用出现异常时,平台会在1s内精准锁定出问题的数据源和其所处的层次。
9421446837e6e3d459367044665e50e01c8d3b61
在今天,数据资源平台被部署到了企业的厂房和城市大脑,已经实现了标准化、集约化和规模化。因此,工程师们再也不用在高温机房内一边挥洒汗水,一边编写代码,而只用简单的在平台上进行点击操作。
6b35f8dde4ade747128896e40b4d40e20ec9ad76
下图的城市数字规划平台是和中国城市数据规划研究院联合研究推出的。从之前的“软”的角度进行规划,到现在“软硬兼施”地指挥城市的每一个城区的规划、迭代和生长。城市规划的方案再也不是靠经验堆出来的,而是靠平台计算得到的。每一寸土地的使用、每一层高楼的搭建对周边的影响都可以经由平台计算和量化立即得到,而不需要等到使用、搭建完成之后再进行测量。
bfb8a8c3504beb3d07fa40fa04aca3d076dbd0f1
如果将一栋建筑进行拆解,它会被拆分成钢筋水泥等元素,但是透过其表面对其进行研究,可以定义出它的基因。在全中国300多个城市、470万个地块,平台都实现了对其多维度的描述。有些维度甚至在实时更新,如人口的热力图、交通压力图等。描述中既有静态的指标,也有实时的指标,城市作为一个生命体,被彻底的解构,再也不是靠有多少栋高楼、有多少个停车场来进行浅显的描述。
b45b92f9afe4315901be5df9d4b0f9cf534221c1
此外,我们做到了体征的实时响应和探查,即通过摄像头监控街道上发生的事件和异常,并通过数据分析该异常产生的原因,做到“实时诊断,秒级响应”。在以往的应急响应中,大都是通过民警的预警或周围居民的报警,而在今天,这个报警的任务被交付给了这个平台。
cd074100a5708e7c567ee625750a68cf81f90597
一座城市的发展离不开经济,同样的道理,区域经济大脑的背后也离不开生产数据、交通数据、能源数据和环境数据。在将这些数据融入经济数据模型、产业链、产业带进行转移和变迁的时候,摒弃了以往人工普查的方式,实现了一键点击,智能查询。
f67f8b22e620c89ef688cd19b3b20fca5f9d6807
该平台不仅适用于城市规划,也同样适用于企业。当一家企业经历了不同年代、使用了不同的数据库时,会产生一个痛点——各种数据库的规格、各种数据采集的手段和字段都没有传承。这些企业希望存在一个统一的资源库,并能实现数据的增殖反应。在以往,无序的数据就像下图中的电线一样杂乱无章,但是今天借助于Dataphin,可以做到有序数据的实时汇集和传承,最终实现工具化、自动化、智能化、价值化。
6bae003b3baceeca6b0a9acfbab9868c8efabd92
目前看起来似乎智能之路是畅通无阻的。有了这么多的先进的数据产品,智能社会似乎伸手可及,但是此时此刻所有数据的产生和计算,都是在机房这个基础设施中进行的。如果我们有非常先进的产品,但是对机房的调度方式却十分原始的时候,是无法实现智能化的。这种身在20世纪,使用19世纪的理念来实现21世纪的梦想的历史错位是行不通的。
e2a61f05a03d4519b0fe74c936757d1e91702dfd
在今天,全球的云计算数据中心运行着百万级别的服务器,而这些服务器的平均使用率只有6%到12%,这造成了极大的资源浪费,因此如何使用智能算法提升其资源使用率是一个极大的挑战,让云上的用户能享受更高效、更低成本的服务,让全社会的基础运算设施更节能、更环保、更高效。
走向智能之路,既要从人才抓起,又要从产品抓起,也要从基础设施抓起,这三者缺一不可,这也是整个科技从业者整体的梦想。1982年斯皮尔伯格的电影《ET》中有这么一句话,外星人看地球时,觉得他们的智能十分低等。但是现在,在地球上,还有另一个ET的存在——ET大脑,今天可以将所有思考的因素和基因注入到万物之中,让每一个生物体、每一个基础设施都具备思考的能力,这样智能社会的到来也将不再是一个梦想。
让我们一起奋斗!

相关文章
到底什么是I/O的驱动能力?
到底什么是I/O的驱动能力?
|
3月前
|
存储 编解码 运维
体验报告:《告别资源瓶颈,函数计算驱动多媒体文件处理》解决方案
体验报告:《告别资源瓶颈,函数计算驱动多媒体文件处理》解决方案
96 30
|
3月前
|
编解码 弹性计算 运维
《告别资源瓶颈,函数计算驱动多媒体文件处理》解决方案深度测评
在当今数字化转型的浪潮中,多媒体内容的处理与分发成为企业面临的重大挑战之一。为了应对资源瓶颈,提高处理效率并降低成本,我深入体验了《告别资源瓶颈,函数计算驱动多媒体文件处理》这一创新解决方案,并就其部署过程、性能表现、成本效益及云产品体验进行了全面测评。
56 9
|
3月前
|
机器学习/深度学习 自然语言处理 数据挖掘
数据智能驱动
【8月更文挑战第7天】数据智能驱动
36 2
|
3月前
|
存储 Serverless API
测评《告别资源瓶颈,函数计算驱动多媒体文件处理》解决方案
该体验报告指出,引导文档详尽,涵盖初始设置与示例代码,但需增加常见问题解答及更多高级功能实例。提供的代码示例实用但在处理大文件时存在超时和权限问题。性能方面,处理多媒体文件表现出色,系统稳定,成本控制适宜中小企业。函数计算、对象存储与API网关等云产品在实际应用中表现出色,尤其适用于需要弹性处理的企业场景。建议增强常见问题解答部分以提升用户体验。
57 0
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
数据平台演进问题之数据的资产怎么被AI驱动的数据库理解
数据平台演进问题之数据的资产怎么被AI驱动的数据库理解
|
6月前
|
数据处理 数据安全/隐私保护
智能推荐映射关系,加速数据标准落地进程
在V4.0版本中,Dataphin推出了智能推荐映射关系功能,用户可以基于内置特征或创建自定义特征,对数据内容进行表示,并将其与数据标准关联,进而智能映射映射关系,尤其在字段分布广泛和命名多变的情况下,可以提高映射的准确性和效率,加速了数据标准实施。
306 0
|
6月前
|
人工智能 搜索推荐 机器人
AI Agent涌向移动终端,手机智能体开启跨端跨应用业务连接新场景
AI Agent涌向移动终端,开启跨端跨应用业务连接新场景,手机智能体将成企业AIGC应用新标配。
151 0
|
存储 NoSQL 安全
【MongoDB行业案例】Bosch IoT 和应用程序驱动型分析的重要性
将运营和分析工作负载整合到一处的数据平台
|
算法 Java 程序员
思考:业务驱动技术 or 技术驱动业务
思考:业务驱动技术 or 技术驱动业务
284 0