福特数据总监:汽车业的大数据框架如何构建?

简介:

要实施一个大数据技术框架需要一个战略,在最近举办的Big Data Innovation Summit上, Gahl Berkooz在他题为“In Search of Actionable Insights,”的演讲中就此进行了说明。

Berkooz是迪尔伯恩的福特汽车公司的数据和治理的总监,和与会者简单分享了数据供应链的大数据技术框架,其中包括七大类别,从分析实施到基础设施管理。

但是,关键在于,福特公司并没有同等实施这七大战略。 当一位与会者提问优先战略时, Berkooz没有犹豫。“我们会考虑那些会让福特更加独特,让我们在行业内更加突出,拥有创新的技术,”他说。

这 也是IT领导人,经常听到的建议:将各部门的注意力都集中到如何让业务与众不同,然后和供应商合作。Mark Shaver,是位于密尔沃基的采矿设备和服务公司Joy Global Inc.的副总裁兼首席信息官, 在去年春天举办的Fusion 2015 CEO-CIO Symposium上也提出了类似的观点。企业的工业物联网解决方案并没有使用“现成的”技术,而是与Verizon这样的公司之间良好合作的结果。他们 提供了Joy Global公司没有的,并且不想过多投资的专业技能。

“我不是标准化的CIO,” Shaver说。“我没有数据中心。Outlook是外包的。安全也是外包的。我并不在那些领域投入精力。”

在福特,数据标准和数据质量被认为是构建的基本模块,投入了大量的时间和精力。当然也有充分的理由:“数据是我们分析的资本,可以带来方案,”Berkooz说。“如果不控制数据的质量,那方案的价值将是非常有限的。”

对于无法使福特公司业务差异化的功能,如基础设施管理,身份和安全管理,或数据获取,Berkooz和他的团队则在市场中寻求方案。

消防中的数据分析

Timothy Persons,美国政府问责局的首席科学家,在Big Data summit上的演讲中,讲述了数据分析的案例: 纽约市的分析团队是如何使用数据来整治“非法改建”或私自划分的房屋。

这 个案例之前也分析过,但是它仍然是一个证明数据分析之强大的出色案例。非法改建的房屋容易引起害虫,犯罪和火灾隐患,给消防队员带来不可预见的危险。在去 年春天举行的CDO Summit上, Amen Ra Mashariki,纽约市的现任首席分析官向与会者解释说,在一次火灾中,几位消防队员失去了他们的生命,因为他们无法获取房屋的布局结构的正确信息。 他提出了一个简单的问题:“你应该如何确保消防队员的安全?”

答案就是数据。Persons说,分析团队开始过滤来自不同部门的数据——从911电话到房产税的支付——从而发现非法改建的指向性模式,而不是依靠直觉。

研究团队发现市政府部门也记录类似的位置数据,但使用不同的方式:警察局使用传统的地图坐标,消防队员通过消防栓标注社区地图,而税务部门则根据税号,Persons说。所以团队通过整合来自不同部门的数据,用统一的方式来记录城市内的90万户房屋。

这一方案卓有成效。使用分析而不是直觉,城市检查员在他们检查的房屋中,对其中的70%发布了撤离警告,而之前的数据为12%,Persons说。

规范分析并不是终极领域

Erik Andrejko,是总部位于旧金山的与农业社团合作的数据科学公司Climate Corp.的数据科学副总裁,在峰会上做出了一个大胆声明:分析功能的最新领域并不是规范分析,而是解释分析。

“当你告诉一个决策者——在这种情况下,是一位农民——今天,他们应该在这块土地上施加这些量的肥料,你应该回答的是为什么要这样做,”他说。

解释分析的关键可能是模型。他认为有两种技术可以为此提供帮助:结构建模,他说这是“用于说明环境和作物收成之间的统计关系,”以及机械建模,他说这是“用于捕捉和解释物理机制的物理现象。”

Andrejko认为这两种技术都是相似的,作为“black box”数据挖掘技术之外的补充。“我们需要多种技术,因为通常一项技术不可能适用于每一种情况,”他事后在电子邮件中写道。

原文发布时间为:2015年9月23日
本文来自云栖社区合作伙伴至顶网,了解相关信息可以关注至顶网。
相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
22天前
|
存储 大数据 数据处理
PHP 与大数据:构建高效数据处理系统
传统的数据处理系统往往难以应对大规模数据的处理需求,而PHP作为一种常用的服务器端脚本语言,在数据处理方面也有其独特的优势。本文将探讨如何利用PHP构建高效的大数据处理系统,结合实际案例分析其应用场景及优势所在。
15 2
|
4月前
|
SQL Oracle 物联网
助力工业物联网,工业大数据之数仓维度层DWS层构建【十二】
助力工业物联网,工业大数据之数仓维度层DWS层构建【十二】
47 0
|
4月前
|
SQL Oracle 关系型数据库
助力工业物联网,工业大数据之ODS层构建:代码结构及修改【九】
助力工业物联网,工业大数据之ODS层构建:代码结构及修改【九】
47 0
|
12天前
|
SQL 分布式计算 Hadoop
利用Hive与Hadoop构建大数据仓库:从零到一
【4月更文挑战第7天】本文介绍了如何使用Apache Hive与Hadoop构建大数据仓库。Hadoop的HDFS和YARN提供分布式存储和资源管理,而Hive作为基于Hadoop的数据仓库系统,通过HiveQL简化大数据查询。构建过程包括设置Hadoop集群、安装配置Hive、数据导入与管理、查询分析以及ETL与调度。大数据仓库的应用场景包括海量数据存储、离线分析、数据服务化和数据湖构建,为企业决策和创新提供支持。
49 1
|
5月前
|
人工智能 Cloud Native 大数据
构建高性能云原生大数据处理平台:融合人工智能优化数据分析流程
构建高性能云原生大数据处理平台:融合人工智能优化数据分析流程
189 0
|
1月前
|
SQL 存储 监控
构建端到端的开源现代数据平台
构建端到端的开源现代数据平台
52 4
|
1月前
|
人工智能 DataWorks 数据可视化
心动基于阿里云DataWorks构建游戏行业通用大数据模型
心动游戏在阿里云上构建云原生大数据平台,基于DataWorks构建行业通用大数据模型,如玩家、产品、SDK、事件、发行等,满足各种不同的分析型应用的要求,如AI场景、风控场景、数据分析场景等。
334 1
|
2月前
|
存储 数据可视化 JavaScript
基于Echarts构建大数据招聘岗位数据可视化大屏
基于Echarts构建大数据招聘岗位数据可视化大屏
52 0
|
4月前
|
SQL 存储 分布式计算
助力工业物联网,工业大数据之数仓事实层DWB层构建【十七】
助力工业物联网,工业大数据之数仓事实层DWB层构建【十七】
38 0
助力工业物联网,工业大数据之数仓事实层DWB层构建【十七】
|
4月前
|
数据采集 SQL Oracle
助力工业物联网,工业大数据之DWD层构建:数据抽取分析【十一】
助力工业物联网,工业大数据之DWD层构建:数据抽取分析【十一】
49 0