大数据分析的未来图景:万物皆可分析

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

ZD至顶网CIO与应用频道 11月16日 北京消息:作为业内规模最大的数据分析盛会,Teradata Partners全球用户大会在美国加州顺利举办。正如Teradata 首席执行官兼总裁 Mike Koehler在大会开幕演讲中所言,Teradata Partners是一个独特的大会,它是由客户所组成的委员会规划组织的大会。在本次大会上,Teradata高管演讲中谈的最多的就是“技术创新带来业务转型,改变了未来的业务形态”。

在云计算、大数据之后物联网成为新晋热点话题,物联网改变了我们看待世界的方法,改变了我们做业务的方法,甚至改变我们的生活方式。但是即使是最精通技术的企业也承认,从物联网生成的数据中获取价值非常困难,需要大量技巧。

Teradata认为的数据分析未来图景是“万物皆可分析”,所以在本次大会上也发布了Teradata Listener,其是一款具有实时“听取”功能的自助式智能软件,对客户而言可跟踪他们世界各地存放的多条传感器和物联网数据流,并将该数据传送到分析生态系统中的多个平台,使得我们能够在数据源的发生地就可以进行分析。

大数据分析的未来图景:万物皆可分析

Teradata天睿公司大中华区首席执行官辛儿伦

同时Teradata也强调,在建设数据分析系统中,要避免数据孤岛。由于单一技术无法解决全面数据分析的需求,必须简化各种技术难度,创建统一生态数据管理系统。简化是非常重要的需求,任何数据分析系统都要使得架构简化。所以,在本次大会上,Teradata还更新了其统一数据架构(UDA),推出了在单一机箱内整合Teradata数据仓库、Teradata Aster Analytics和Hadoop系统,使用户能够在更小的数据中心空间内发挥整个分析生态系统管理的优势。

在本次大会上,ZDNet采访了Teradata天睿公司大中华区首席执行官辛儿伦,以下为访谈实录:

ZDNet2015年的大会以Breaking Big为主题,请问其寓意是什么?这是否代表Teradata对于大数据认知在概念上的颠覆?

辛儿伦:Breaking Big这个主题,我理解最核心的应该是“打破束缚和限制”,不管是企业还是个人应该探索和追求“创新、差异化、勇气、重大进展和卓越表现。”

第一,在大数据时代,企业必须坚持创新和追求创新,不管技术上寻找突破,还是从业务流程、商业模式、组织架构、企业的分析文化上,都可进行积极的创新。例如,去年我们刚刚收购的Think Big公司,帮助我们增强对Hadoop的咨询、顾问和实施能力, 以及与其它分析平台的交互能力。在本次大会上,我们刚宣布Think Big成为业内首个能够为Hadoop数据湖(数据资源池)提供全面的管理服务,这将帮助企业非常便利地创建数据分析的生态系统,确保数据质量、可靠性、实时性以及日常的运营任务。

我强调一下,我们的Think Big公司支持主要的Apache™ Hadoop®,包括Cloudera、Hortonworks、MapR、Spark、Kafka、NoSQL以及其他开源技术,非常全面。而且更重要的是,我这里也是首次宣布,我们的Think Big业务已经确定引入到大中华区,目前已经在完成人员的配备。

第二,我觉得企业中在数据分析上的务实和积极进取的文化非常重要。其中,这个主题中提到“勇气”是企业实现大数据项目成功的重要保证。很多的企业,曾经面对大数据项目的投资犹豫、徘徊,其实这就需要更大的勇气支持。Teradata以及广大客户的反馈已经看到,我们是时候积极行动了。我们也理解,文化上的转变可能比技术和分析流程上的转变历时更久,但是我们一直强调,大数据从小做起,相信你也能很快看到大数据的价值,看到大数据分析在商业变革中带来的不可替代的驱动力。

ZDNet:每年的全球用户大会,Teradata都会发布业界注目的新产品。今年发布的产品中,您认为哪些是最具亮点的?

辛儿伦:今年,我们在大数据技术、开源技术的支持以及咨询服务上都有重要的更新和发布。这里,我特别强调一下,本次大会上最亮点的应该是针对物联网的传感器数据的分析能力,甚至实现了万物皆可分析(Analytics of Everything)。Teradata Listener技术能够通过整合开源技术,帮助客户分析物联网中不计其数的数据源,简化数据分析的难度。Teradata QueryGrid技术能在统一数据架构上快速有效地进行主题分析或查询多元化的大数据,以取得业务需要的信息。

同时,Teradata Aster新的版本能直接交互Hadoop数据资源池或数据仓库平台,帮助客户进行实时的数据探索,例如高效营销中进行客户路径和消费模式分析,等等.

ZDNet:最近,Gartner发布了2016 年可能影响企业的十大技术趋势,其中万物信息化以及物联网等技术入选。在目前发展出现这些趋势之时,您怎们看技术的发展趋势?如果时间放长远一点,据您观察未来5年甚至10年,那些技术可能会成为影响企业比较显著的技术趋势?

辛儿伦:我们看到这些十大技术趋势,这些都是战略性大趋势,其中包括Information of Everything(万物信息化)以及物联网架构和平台。其实,我认为这不仅是趋势,而是新的IT现实。

关于万物信息化,可以理解为我们身处在一个数字网格之中,这个环境会产生、使用其产生的无计其数的信息。在这些数据和信息的海洋中,不管是企业还是个人,必须学会判断和识别哪些信息能够带来战略性的价值,掌握如何访问这些不同的数据源,并通过各种分析方法和算法找出其中的业务价值。

其实,这些预测也是真实IT现实的写照。实现万物皆联网或者信息化,最主要之一靠传感器技术。在我们目前生活的时代,传感器技术结合大规模并行处理能力,使我们能够测量并整体分析几乎所有现象。先进的仪器使我们能够跟踪万物的变化,例如天气变化模式、汽车驾驶习惯、乃至快餐店冰箱的温度、医院里(或家里)病人的生命体征。将这些数据采集至数据库,并运用广泛的统计、分析及可视化工具对这些数据进行细致的分析。

正是由于这些传感器,我们的生活、工作中产生了新的数据源。例如,通过射频识别读取器,我们能够进行零售库存跟踪与控制、医疗测试采样跟踪、预防欺诈行为等;通过GPS定位跟踪器,能够进行车队管理和交通运输和货运管理;通过数据采集传感器,我们就能在制造业、环境保护、交通运输系统中采集到实时的数据用于分析。

例如,西门子公司就通过部署Teradata技术提升其制造流程及产品质量。西门子首次实现了整合来自传感器、制造流程、机器生成数据,以及各种源系统的数据。西门子技术领域商业分析及监测总监Michael May博士对此说:“现在,我们可以更快、更有效地获得数据中的价值。把大数据转换为智能数据,我们将能够优化产品质量,为客户提供更加优质的服务。”

关于物联网我提两点:《2014-2015年中国物联网发展年度报告》中指出,物联网技术与云计算、大数据、移动互联网等新兴一代信息技术的协同创新进一步深化,与农业、制造业、服务业等传统产业,与新能源、新材料、先进制造业等新兴产业的“双向融合”不断加强。物联网加快向经济、社会、生活众多领域渗透,不断催生新变革、新应用和新业态。这些都是非常可喜的发展成绩。现在快速发展的物联网,以及未来的“万物皆联网”,任何人、事、物之间将能实现连接,这将带来沟通模式的变化、业务模式的变化,甚至发展模式的变化。

但是,我们更要强调,要想让物联网发挥出价值,企业必须对传感器数据进行整合和分析,并把分析结果利用到生产流程中来,而由大数据驱动的物联网才是有价值的物联。

由于物联网数据都是非结构化数据,这种JSON数据的分析都非常复杂。在今年5月,我们就宣布首次在同一数据库实现三大JSON数据格式的原生存储,这将为客户提供更强的查询性能。通过对Teradata数据库升级,能够帮助业务用户充分利用网页应用、传感器和物联网机器生成JSON数据的商业价值。而Teradata数据库具备分析JSON数据、操作数据和历史业务数据的强大功能,而这一顶级查询性能使其成为物联网分析枢纽。此外,本次大会上发布的Teradata Listener是一款自助式智能软件,具有实时“听取”功能,可协助客户跟踪他们世界各地存放的多条传感器和物联网数据流,并将该数据传送到分析生态系统中的多个平台,这些都是巨大的技术突破。

针对未来更长时间的趋势预测,如果从更加宏观的角度看,我们先梳理一下整个IT 行业的发展,然后就能看到未来的发展趋势。过去从70或者80年代开始,对整个IT产业的关注,不管是产业给予的专注,还是IT供应商的专注,或是企业对于成立自己的IT部门的专注,更多的是一种小I大T的专注,什么叫小I大T?小的专注于Information能够体现的价值,而大量专注于运用用和研发Technology方面的议题。这就是小I大T,更多地认为IT就只是Technology这个课题,但是我们要注意IT不仅仅是Technology,IT是两个课题,是Information和Technology。

随着技术的发展,现在的技术能够承载的Information的价值度是迅速提升的,,未来更多的机会会更多在Information这个主题,延伸出来未来10年、20年、30年的前景。特别是未来这30年,这个时代将会是大I小T的时代,更多的主轴是在Information主题。,

ZDNet:从Teradata以及服务客户的经验看,如果让您建议一个企业要建立起自己的大数据战略,应该要去准备什么战略?

辛儿伦:首先建议客户要先问自身几个问题,那就是为什么要建立自己的大数据战略?是什么业务发展方向需要数据驱动型战略?。大数据战略要针对具体的业务场景,有了明确的业务场景目标,建设驾驭大数据的能力才有针对性性和使命感。

例如某企业要提升他的客户价值贡献度,希望建立起大数据战略,能够通过与客户的多种互动渠道的信息中获得洞察例如通过360度的统一客户视图等,在正确的时间、正确的地点、适当的方式,提供这位客户需要的服务或产品。又如金融机构通过建立起针对风险控制的大数据战略,能够发现和判断自己企业面对的风险以及危害程度,如担保圈分析等。如电信运营商可以通过建立针对客户服务品质优化的大数据战略,发现即将离网的用户等,提高自己的业务支持并挽留用户。

但是,在这里我要强调一点,数据驱动型战略不等同于数据收集战略,目前企业应尽量避免“存而不用”,建立大数据能力绝不是收集数据、存数据。

根据我们协助全球许多客户建设高效的大数据战略呢?,我想分享几个成功的关键:

第一,全面。企业需要采取宏观视角来识别构成高效体系的诸多不同要素,将不同的数据集(比如内部和外部数据流,或来自企业不同职能部门的信息)链接起来,通过关联分析,找出富有意义的信息。

第二,以业务为核心。针对大数据的战略规划应当以业务为导向,大数据战略并非科学项目,而是必须以满足实际的业务需求为核心。

第三,灵活。必须考虑到未来的使用情形,大数据战略和大数据分析方法论应避免常见的限制,比如过多地依赖于单一技术或单一平台模式或过于制式的流程等;由于数据驱动的转型不会一步到位或立刻传遍整个企业,因此在制定战略时,必须认识到价值是逐步创造出来的,并将整个演变过程考虑在内。

第四,有条理且可扩展。要确保大数据战略能够得到全面贯彻,而不是导致另一大群数据孤岛的产生。

第五,数据分析、科学决策。形成以分析为导向的思维方式,并培养真正的数据驱动文化。

原文发布时间为:2015年11月16日
本文作者:王聪彬
本文来自云栖社区合作伙伴至顶网,了解相关信息可以关注至顶网。
相关实践学习
钉钉群中如何接收IoT温控器数据告警通知
本实验主要介绍如何将温控器设备以MQTT协议接入IoT物联网平台,通过云产品流转到函数计算FC,调用钉钉群机器人API,实时推送温湿度消息到钉钉群。
阿里云AIoT物联网开发实战
本课程将由物联网专家带你熟悉阿里云AIoT物联网领域全套云产品,7天轻松搭建基于Arduino的端到端物联网场景应用。 开始学习前,请先开通下方两个云产品,让学习更流畅: IoT物联网平台:https://iot.console.aliyun.com/ LinkWAN物联网络管理平台:https://linkwan.console.aliyun.com/service-open
目录
相关文章
|
1月前
|
存储 机器学习/深度学习 SQL
大数据处理与分析技术
大数据处理与分析技术
116 2
|
2月前
|
SQL 消息中间件 分布式计算
大数据-124 - Flink State 01篇 状态原理和原理剖析:状态类型 执行分析
大数据-124 - Flink State 01篇 状态原理和原理剖析:状态类型 执行分析
80 5
|
5天前
|
机器学习/深度学习 数据可视化 大数据
机器学习与大数据分析的结合:智能决策的新引擎
机器学习与大数据分析的结合:智能决策的新引擎
64 15
|
11天前
|
SQL 分布式计算 DataWorks
DataWorks产品测评|基于DataWorks和MaxCompute产品组合实现用户画像分析
本文介绍了如何使用DataWorks和MaxCompute产品组合实现用户画像分析。首先,通过阿里云官网开通DataWorks服务并创建资源组,接着创建MaxCompute项目和数据源。随后,利用DataWorks的数据集成和数据开发模块,将业务数据同步至MaxCompute,并通过ODPS SQL完成用户画像的数据加工,最终将结果写入`ads_user_info_1d`表。文章详细记录了每一步的操作过程,包括任务开发、运行、运维操作和资源释放,帮助读者顺利完成用户画像分析。此外,还指出了文档中的一些不一致之处,并提供了相应的解决方法。
|
10天前
|
分布式计算 DataWorks 搜索推荐
用户画像分析(MaxCompute简化版)
通过本教程,您可以了解如何使用DataWorks和MaxCompute产品组合进行数仓开发与分析,并通过案例体验DataWorks数据集成、数据开发和运维中心模块的相关能力。
|
29天前
|
机器学习/深度学习 存储 大数据
在大数据时代,高维数据处理成为难题,主成分分析(PCA)作为一种有效的数据降维技术,通过线性变换将数据投影到新的坐标系
在大数据时代,高维数据处理成为难题,主成分分析(PCA)作为一种有效的数据降维技术,通过线性变换将数据投影到新的坐标系,保留最大方差信息,实现数据压缩、去噪及可视化。本文详解PCA原理、步骤及其Python实现,探讨其在图像压缩、特征提取等领域的应用,并指出使用时的注意事项,旨在帮助读者掌握这一强大工具。
69 4
|
1月前
|
关系型数据库 分布式数据库 数据库
PolarDB 以其出色的性能和可扩展性,成为大数据分析的重要工具
在数字化时代,企业面对海量数据的挑战,PolarDB 以其出色的性能和可扩展性,成为大数据分析的重要工具。它不仅支持高速数据读写,还通过数据分区、索引优化等策略提升分析效率,适用于电商、金融等多个行业,助力企业精准决策。
35 4
|
1月前
|
机器学习/深度学习 分布式计算 算法
【大数据分析&机器学习】分布式机器学习
本文主要介绍分布式机器学习基础知识,并介绍主流的分布式机器学习框架,结合实例介绍一些机器学习算法。
207 5
|
1月前
|
存储 监控 数据挖掘
【Clikhouse 探秘】ClickHouse 物化视图:加速大数据分析的新利器
ClickHouse 的物化视图是一种特殊表,通过预先计算并存储查询结果,显著提高查询性能,减少资源消耗,适用于实时报表、日志分析、用户行为分析、金融数据分析和物联网数据分析等场景。物化视图的创建、数据插入、更新和一致性保证通过事务机制实现。
161 14
|
1月前
|
消息中间件 分布式计算 大数据
数据为王:大数据处理与分析技术在企业决策中的力量
【10月更文挑战第29天】在信息爆炸的时代,大数据处理与分析技术为企业提供了前所未有的洞察力和决策支持。本文探讨了大数据技术在企业决策中的重要性和实际应用,包括数据的力量、实时分析、数据驱动的决策以及数据安全与隐私保护。通过这些技术,企业能够从海量数据中提取有价值的信息,预测市场趋势,优化业务流程,从而在竞争中占据优势。
115 2