卜晓军:IBM的大数据战略全面升级

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

本文讲的是卜晓军:IBM的大数据战略全面升级,当前,行业对于“大数据”的关注疾速攀升,这并不亚于数据本身的增长程度。您是否想过,我们看到的“谈大数据色变”或许只是个表象,走在行业前列的企业早已开始默默挖掘大数据中蕴含的“金矿”,为自己的业务飙升迈出制胜一步。

  作为行业引领者,IBM一直走在新趋势的前沿,对于大数据更是全力融合创新技术与行业经验助力客户梳理大数据概念,选择战略方向,制定方案策略,实现行业落地:今年5月,IBM智慧的分析洞察正式发布,为大数据环境下的企业描绘了一幅宏伟的战略蓝图。在此基础上,IBM全面整合内部资源,搭建了融软件、硬件、服务为一体的大数据平台,为企业提供易执行、低成本、高效率的大数据解决方案。在行业方面,IBM为行业企业量身定制的大数据解决方案优势充分凸显,大数据制胜策略已不再纸上谈兵,实践之花也开遍制造、电信、金融等诸多行业。

  IBM软件集团大中华区业务分析洞察及智慧地球解决方案总经理卜晓军认为自从5月17日智慧分析洞察在全球发布,一直到今天IBM一直在不断的演进和推进大数据。

  大数据的三个特性

  卜晓军指出,大数据引起的新革命其实也是IBM在定义大数据很重要的一个观点。过去两年里所产生的大量的数据占到人类所积累的数据的90%,这种信息的巨大的爆炸,相应的IT的处理能力、存储能力不断在增加,如何去处理这些数据。我们看到有一些相应的维度,看到数量很大,我们说海量数据,我们看到每天的Twitter产生的数据量为12兆字节,我们的电表数一年有3500亿,在很多行业里,每天的交通信息,大家知道有地感线圈,每一辆车通过都会产生一个讯息。在电力里,不仅是读表,在发电这一块,比如风力发电,风力发电机运转的状态和发电的效能有实时信息的捕捉,这些信息从各方面都产生过来,到底怎么样去处理它,这个数据量是非常大的。

卜晓军:IBM的大数据战略全面升级
▲IBM软件集团大中华区业务分析洞察及智慧地球解决方案总经理卜晓军

  二是速度。以银行交易为例我们每秒中有500万笔的交易数量的发生,每天有5亿的通话详单。这些数据产生了,我们能存下来就不错了,但是如何分析,我们如何分析在流动中的数据?帮助我们进行及时的决策。我们希望我们的决策是实时的,以秒为单位进行决策,而不是以天为单位的决策。比如银行的反欺诈,我们不希望信用卡的潜在欺诈发生的时候,过了两天才找到,我希望以分钟为单位就能够确定或者是评估说这是一笔可能的欺诈,发起相应的欺诈相关的处理流程。看到我们有这些数据在快速中的处理数据的时候,当我们不能有更好的处理的时候,我们没有办法应对现在业务上的挑战。

  三是多样性。我们有各种简单的信号,也有复杂的文字信息,文本信息,我们的图像信息,声音的信息,这些信息是巨大的。而且很多时候这种信息从沟通模式不断改变我们的生活,以及改变我们企业的业务模式,很典型的,很多人的手机用iPhone和安卓,很多人装了微信,腾讯的微信对于电信的短信业务产生了巨大的影响,不仅是可以发送文字信息,可以发送图片,甚至发送简短的语音信息。这些变革在身边不断发生,这些大量的数据存在那里,我们如何更好的对他利用起来,去发掘。

卜晓军:IBM的大数据战略全面升级
▲大数据只是一个开始

  这是大数据的三个特性 3个“V”,数量、速度、多样性。其实IBM今天又提出一个维度来看大数据,是它的数据的真实性。因为我们今天要基于我们可确认的信息来做决策,而今天在世界上所产生很多的信息是各个维度的,我们不分析它,就是一个存在数据库里的数据,我们只有分析它才有可能发现它内在的价值。有的信息是确定的,比如今天大家看财务报表,很多企业有数据仓库,运行它的财务报表,里面的数据是确定的,每一笔数据都是经过清洗和整理,包括报表合并整理出来的。IBM对华尔街去宣布我们一年收入的时候,这个数据是真实而准确的,可是有一些数据是像金子一样,是散落在沙子里是要淘出来的,比如我们的社交媒体数据,比如我们很多的数据,比如通话记录详单,难道就是给个人查询通话记录吗?其实里面蕴含着金矿,可以分析客户的通话行为,甚至发现客户可能流失的原因等等。这是我们过去看到一些帮助我们做决策的信息,还有一些是不能做决定的,也可以帮助我们做决策的信息,我们怎么去分析它,怎么发现数据背后的真实性,同时如何进行大数据的管控和治理,这就变得尤为重要。我们传统的数据仓库和数据信息可以进行管控和审计,但是大数据出来的信息怎么样去做到它的真实性以及信息的管控,这也是IBM在业界特别强于其他厂商重要的维度,后面我们其他同事还有更多的展开。

  IBM的大数据战略全面升级

  从今年年初提到大数据,我们3月份在美国纽约有整个智慧的分析洞察的发布,5月份在中国大数据平台的发布到今天我们大数据平台的升级和更新,希望让大家了解到我们从三个方面,IBM的大数据在业界的领导地位是怎么去树立的?一是我们全面的战略理论“3A5步”,我们的大数据是在IBM完整的软件体系架构里综合能力的体现。后面一页会提到“3A5步”。 IBM的大数据是利用IBM端到端的能力,利用IBM过去20年在企业的信息架构里所积累下来的能力,帮助去打造不是一个点的大数据能力,不是说今天有一个分布式文件系统或者某一个产品,而是一个端到端的“3A5步”的完整的能力。这是我们所看到的IBM综合的能力。我们有独特的解决方案,不仅有刚才大数据的基础架构平台,我们在基础架构平台上IBM有业界非常领先的分析能力,包括文本分析、情感分析,基于流数据的分析和很重要的数据的真实性,如何进行信息的安全,针对于信息进行管控,这是IBM有着完整的端到端的能力。三是丰富的落地实践。大数据最早看到有不同的观念出来,但是实际上是在这两三年不断被提到,大数据是我们用来解决刚才说到的我们所面临的这些数据和信息,我们要去处理它,发掘背后的商业价值,这是大数据平台的宗旨。

卜晓军:IBM的大数据战略全面升级
▲更多报道点击进入专题

  “3A5步”也提到我们的掌控信息、获悉洞察、采取行动、转型和学习,这是IBM在业界无可比拟的能力。IBM是唯一一个能够把大数据从信息的获取到信息的整合、信息的预测分析以及部署到行动。

作者: 李伟 

来源: IT168

原文标题:卜晓军:IBM的大数据战略全面升级

相关实践学习
基于Hologres轻松玩转一站式实时仓库
本场景介绍如何利用阿里云MaxCompute、实时计算Flink和交互式分析服务Hologres开发离线、实时数据融合分析的数据大屏应用。
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
5月前
|
数据采集 机器学习/深度学习 人工智能
面向 MoE 和推理模型时代:阿里云大数据 AI 产品升级发布
2025 AI 势能大会上,阿里云大数据 AI 平台持续创新,贴合 MoE 架构、Reasoning Model 、 Agentic RAG、MCP 等新趋势,带来计算范式变革。多款大数据及 AI 产品重磅升级,助力企业客户高效地构建 AI 模型并落地 AI 应用。
|
4月前
|
机器学习/深度学习 运维 大数据
大数据如何驱动智能制造的升级与蜕变?
大数据如何驱动智能制造的升级与蜕变?
106 12
|
12月前
|
存储 SQL 缓存
快手:从 Clickhouse 到 Apache Doris,实现湖仓分离向湖仓一体架构升级
快手 OLAP 系统为内外多个场景提供数据服务,每天承载近 10 亿的查询请求。原有湖仓分离架构,由离线数据湖和实时数仓组成,面临存储冗余、资源抢占、治理复杂、查询调优难等问题。通过引入 Apache Doris 湖仓一体能力,替换了 Clickhouse ,升级为湖仓一体架构,并结合 Doris 的物化视图改写能力和自动物化服务,实现高性能的数据查询以及灵活的数据治理。
488 3
快手:从 Clickhouse 到 Apache Doris,实现湖仓分离向湖仓一体架构升级
|
5月前
|
机器学习/深度学习 运维 Kubernetes
AllData数据中台升级发布 | 支持K8S数据平台2.0版本
杭州奥零数据科技有限公司成立于2023年,专注于数据中台业务,维护开源项目AllData并提供商业版解决方案。AllData提供数据集成、存储、开发、治理及BI展示等一站式服务,支持AI大模型应用,助力企业高效利用数据价值。
|
9月前
|
SQL 存储 分布式计算
MaxCompute近实时数仓能力升级
本文介绍了阿里云自研的离线实时一体化数仓,重点涵盖MaxCompute和Hologres两大产品。首先阐述了两者在ETL处理、AP分析及Serverless场景中的核心定位与互补关系。接着详细描述了MaxCompute在近实时能力上的升级,包括Delta Table形态、增量计算与查询支持、MCQ 2.0的优化等关键技术,并展示了其性能提升的效果。最后展望了未来在秒级数据导入、多引擎融合及更高效资源利用方面的改进方向。
|
10月前
|
人工智能 Cloud Native 数据管理
媒体声音|重磅升级,阿里云发布首个“Data+AI”驱动的一站式多模数据平台
在2024云栖大会上,阿里云瑶池数据库发布了首个一站式多模数据管理平台DMS:OneMeta+OneOps。该平台由Data+AI驱动,兼容40余种数据源,实现跨云数据库、数据仓库、数据湖的统一数据治理,帮助用户高效提取和分析元数据,提升业务决策效率10倍。DMS已服务超10万企业客户,降低数据管理成本高达90%。
439 19
|
11月前
|
分布式计算 大数据 Serverless
云栖实录 | 开源大数据全面升级:Native 核心引擎、Serverless 化、湖仓架构引领云上大数据发展
在2024云栖大会开源大数据专场上,阿里云宣布推出实时计算Flink产品的新一代向量化流计算引擎Flash,该引擎100%兼容Apache Flink标准,性能提升5-10倍,助力企业降本增效。此外,EMR Serverless Spark产品启动商业化,提供全托管Serverless服务,性能提升300%,并支持弹性伸缩与按量付费。七猫免费小说也分享了其在云上数据仓库治理的成功实践。其次 Flink Forward Asia 2024 将于11月在上海举行,欢迎报名参加。
561 6
云栖实录 | 开源大数据全面升级:Native 核心引擎、Serverless 化、湖仓架构引领云上大数据发展
|
12月前
|
人工智能 Cloud Native 数据管理
重磅升级,阿里云发布首个“Data+AI”驱动的一站式多模数据平台
阿里云发布首个AI多模数据管理平台DMS,助力业务决策提效10倍
1377 17
|
11月前
|
存储 SQL 缓存
Apache Doris 3.0 里程碑版本|存算分离架构升级、湖仓一体再进化
从 3.0 系列版本开始,Apache Doris 开始支持存算分离模式,用户可以在集群部署时选择采用存算一体模式或存算分离模式。基于云原生存算分离的架构,用户可以通过多计算集群实现查询负载间的物理隔离以及读写负载隔离,并借助对象存储或 HDFS 等低成本的共享存储系统来大幅降低存储成本。
566 0
Apache Doris 3.0 里程碑版本|存算分离架构升级、湖仓一体再进化
|
SQL 人工智能 分布式计算
飞天发布时刻:大数据AI平台产品升级发布
阿里云飞天发布时刻产品发布会围绕阿里云大数据AI平台的新能力和新产品进行详细介绍。人工智能平台PAI、云原生大数据计算服务MaxCompute、开源大数据平台E-MapReduce、实时数仓Hologres、阿里云Elasticsearch、向量检索Milvus等产品均带来了相关发布的深度解读。