李永辉:IBM大数据产品及实践路线图

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:
文章讲的是 李永辉:IBM大数据产品及实践路线图近日,主题为“行胜于言”的2013 IBM大数据与分析高峰论坛在北京举行,会上正式发布了大数据分析加速技术BLU Acceleration以及面向Hadoop的PureData版本,同时,IBM大数据平台的旗舰产品BigInsights、Streams、DB2、Informix的升级版本也在本次大会上亮相。IBM全球副总裁兼大中华区软件集团总经理胡世忠、IBM全球副总裁兼IBM中国开发中心总经理王阳、IBM大中华区系统与科技事业部技术总监李永辉等IBM高层出席了此次大会,分享了IBM大数据与分析创新技术的最新进展。

IBM大数据探索
▲IBM大中华区系统与科技事业部技术总监 李永辉

  IBM大数据探索

  大数据从何而来?李永辉表示,实际上这些数据主要来源于三个方面,分别是传统的结构化数据、非结构化数据和流数据。具体来说,随着技术和信息来源的不断发展,企业处理结构化数据出现了很多新的技术,如CPU的速度、闪存的技术等。而非结构化数据在移动互联网的带动下,产生越来越多的信息,利用这些数据就可以挖掘出有用的信息。另外,流媒体产生巨大的流数据,是大数据首先需要挖掘的新的数据来源。

  探索和挖掘大数据,发现业务相关的兴趣点,从而更好的制定决策。对于大数据,企业一般有以下需求:不给定假设条件,探索现有企业数据和内容之外的新数据资源的潜在价值;给定假设条件,挖掘业务需求相关信息;关联上下文中不同来源的信息并评估非结构化内容的商业价值;使用可视化、算法和处理发现兴趣模式;防止探索过程中的敏感信息暴露。

IBM大数据探索
▲IBM大数据探索架构图

  如何利用IBM的软件解决方案从大数据中抓取有用的信息呢?李永辉表示,在IBM的大数据解决方案中,IBM Streams提供了抓取和分析流数据的能力;BigInsight是IBM提供的企业版Hadoop架构,能够对非结构化数据做进一步的分析;Warehouse处理传统的结构化数据,针对数据量的增加做了很多改进;Data Explorer and Content Analytics抓取有用的信息寄存在数据仓库中,并提供多个数据的挖掘和关联性的分析。

  在IBM大数据分析解决方案中,Cognos BI是一个报表分析工具,可以从多个数据库的结构化和非结构化数据中抓取有用信息,并针对大量历史数据进行预测。透过IBM SPSS工具建立数学模型,根据收集数据的特征也可以预测未来。

  预测是大数据发展的一大特色。以IBM的客户——中国气象局为例,需要通过大量数据来预测未来天气情况,主要包括三种类型的预测:一是气候模型的预测,推测下一个冬天是冷冬还是暖冬;二是短期的预报,主要利用物理模型推测未来气候变化;三是卫星的推测,即临近天气预报,预测未来几小时的天气情况。中国气象局采用IBM PureSystem后,比前一代系统提高了50倍性能和100倍的存储容量。


作者:小野

来源:IT168

原文链接:IBM:李永辉:IBM大数据产品及实践路线图

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
5天前
|
SQL 分布式计算 运维
如何对付一个耗时6h+的ODPS任务:慢节点优化实践
本文描述了大数据处理任务(特别是涉及大量JOIN操作的任务)中遇到的性能瓶颈问题及其优化过程。
|
26天前
|
SQL 分布式计算 DataWorks
DataWorks产品使用合集之如何开发ODPS Spark任务
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
|
21天前
|
DataWorks Kubernetes 大数据
飞天大数据平台产品问题之DataWorks提供的商业化服务如何解决
飞天大数据平台产品问题之DataWorks提供的商业化服务如何解决
|
8天前
|
人工智能 分布式计算 DataWorks
大数据&AI产品月刊【2024年8月】
大数据& AI 产品技术月刊【2024年8月】,涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。
|
21天前
|
分布式计算 搜索推荐 物联网
大数据及AI典型场景实践问题之通过KafKa+OTS+MaxCompute完成物联网系统技术重构如何解决
大数据及AI典型场景实践问题之通过KafKa+OTS+MaxCompute完成物联网系统技术重构如何解决
|
21天前
|
人工智能 分布式计算 架构师
大数据及AI典型场景实践问题之基于MaxCompute构建Noxmobi全球化精准营销系统如何解决
大数据及AI典型场景实践问题之基于MaxCompute构建Noxmobi全球化精准营销系统如何解决
|
21天前
|
机器学习/深度学习 搜索推荐 算法
飞天大数据平台产品问题之AIRec在阿里巴巴飞天大数据平台中的功能如何解决
飞天大数据平台产品问题之AIRec在阿里巴巴飞天大数据平台中的功能如何解决
|
21天前
|
存储 人工智能 搜索推荐
飞天大数据平台产品问题之阿里云OpenSearch的定义如何解决
飞天大数据平台产品问题之阿里云OpenSearch的定义如何解决
|
26天前
|
SQL 分布式计算 DataWorks
DataWorks产品使用合集之未保存的ODPS SQL语句该如何找回
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
|
26天前
|
分布式计算 DataWorks 关系型数据库
DataWorks产品使用合集之ODPS数据怎么Merge到MySQL数据库
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。