Pivotal推出全球首款开源企业级大数据产品套件

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介:

开源先锋Pivotal今天宣布,推出最新版Pivotal大数据套件。该套件是新一代大数据解决方案,旨在帮助客户更快地用大数据创造价值。Pivotal将开放Pivotal大数据套件核心组件的源代码,这在业界尚属首次。

Pivotal开发大数据产品已经超过25年,客户遍及全球各行各业。现在,Pivotal凭借在这一领域积累的丰富经验,进一步为客户提供开源产品选择,加速其数据驱动型应用。Pivotal大数据套件的核心组件,包括全球领先的分析型MPP数据仓库Pivotal Greenplum数据库、全球最先进的企业SQL on Hadoop分析引擎Pivotal HAWQ以及领先的优质NoSQL内存数据库Pivotal GemFire,都将首次基于开源内核。贡献给业界的将是一个开放的、全功能的内核,可以提供关键任务应用的伸缩性、先进的客户支持、针对要求苛刻的企业工作负载进行的性能优化,以及高级的运维工具。

Pivotal数据产品事业部副总裁SundeepMadra表示:“在实现大数据真正为企业所用的征途中,Pivotal大数据套件是一个重要的里程碑。通过向开源社区开放Pivotal HD、HAWQ、Greenplum数据库和GemFire,我们将为整个市场贡献开发新一代数据基础架构解决方案所需要的组件。开放这些组件的源代码将有助于加速客户采用这些组件,提高创新速度。”

兑现开放云平台承诺

目前,客户的关注点已经从存储数据转变为释放数据潜能,这就需要更加敏捷的数据使用方式。Pivotal大数据套件也为客户提供了一种基于开源软件的、可以灵活地使用云技术来部署的
敏捷的数据解决方案,

Pivotal BigData Suite除了已提供的裸机、基于一体机以及虚拟化软件交付方式之外,现在增加对公有云、私有云及混合云的支持。此外,通过内置的Pivotal CF运行管理器,还可以将Pivotal大数据套件作为PaaS服务,将大数据的能力提供给基于Pivotal Cloud Foundry的应用。

企业管理联合公司(Enterprise Management Associates)研究总经理John L Myers表示:“要成功实现物联网,就需要这类开放、敏捷、自适应型平台。Pivotal能够整合开放系统、成熟技术和云交付方式,擅长用各种方法实现敏捷性,因此非常适合在不断变化的大数据及物联网领域创造价值。”

一次订购,多种选择,灵活使用

Pivotal大数据套件将是业界首套、也是惟一一套基于开源内核的企业级大数据产品。这个灵活的套件同时面向应用开发人员和数据分析师,将消除与大数据部署有关的各种障碍。企业现在可以灵活地部署数据湖,可以有强大的高级分析及数据科学工具,还可以有一套基本构件,支持在混合云环境中定制以数据为中心、横向扩展的应用。

Pivotal大数据套件中包括最新应用服务功能

Pivotal大数据套件中包括几种最新数据服务功能:

● (最新)Pivotal CF上的Pivotal大数据套件(Pivotal Big Data Suite on Pivotal Cloud Foundry),利用以领先的“开放云平台即服务”模式运行的应用,提供先进的数据服务功能。
● (最新)Spring XD,高可扩展性的开源分布式框架,面向数据获取、批处理以及数据分析流水线管理。
● (最新)Redis,领先的、可扩展的开源键值存储及数据结构服务器。
● (最新)RabbitMQ,领先的可扩展、开源、可靠、面向应用的消息队列。

统一、开放的大数据使用方式

为了满足客户及市场在大数据领域的统一化要求,Pivotal正在与其他数据行业领导者联手,为客户提供稳定、安全和互操作的基础平台。

Pivotal当天还在其他新闻稿中宣布,将参与开放数据平台计划,进一步推动协作,推动可扩展的现代数据架构在企业中普及应用。
此外,Pivotal此前已宣布,与Hortonworks结成战略联盟,以简化企业采用Apache™ Hadoop®的过程,支持Pivotal HAWQ之类的先进服务在Hortonworks数据平台上运行。

Pivotal公司、客户及合作伙伴高管引言

Pivotal公司总裁Scott Yara:“我们的大客户/合作伙伴对此积极响应,令我们备受鼓舞。我们希望,在这个传统上一直由封闭、专用的数据库产品占据主导地位的行业中,我们此次的开源行动将成为一个重要的转折点。”

Trifacta公司创始人、首席战略官Joe Hellerstein:“开放Greenplum数据库的源代码是业界天大的好消息。我们所有人第一次有了真正企业级、全功能、具备海量并行处理能力的数据库引擎。而且别忘了,Greenplum代码库及API仍未远离其PostgreSQL之根,因此,主要开源社区现在有了向大数据升级的清晰途径。让更多的人从更多的数据中获取更大的价值,这是我们公司的使命和愿景所在。”

CoreLogic公司技术与产品架构副总裁Rob Carpenter:“Pivotal为我们公司创造了巨大商机。通过开放其数据套件核心组件的源代码,Pivotal向业界表明了鲜明的立场,即接受开源社区很重要,建立更加透明的客户关系也很重要。我们盼望加强与Pivotal的合作,Pivotal今天发布的消息令我们备受鼓舞。”

Marsh下属公司CSSTARS总裁PaulMarushka:“在借助开源社区促进创新及产生变革性产品方面,Pivotal拥有悠久历史。我们公司一直与Pivotal紧密合作,以运用尖端的数据整合及分析技术提升我们基于云的新一代风险管理平台,将来自有关各方的数据集成到风险管理生态系统中。”

美国普渡大学信息技术副校长兼首席信息官、信息技术Oesterle教授Gerry McCartney:“我们的‘学生成功分析工具’运用大量数据、Pivotal大数据技术以及尖端的数据科学算法,为学生们取得成功提供了必要的支持。新一代工具将以Pivotal大数据套件为核心,使我们能够利用更多的信息资源关注、发现并招收有工程兴趣和天赋的学生。与Pivotal一起亲历这一新篇章的开启令我们倍感振奋。”

凯捷公司(Capgemini)全球大数据副总裁Steve Jones:“我们与Pivotal开发‘企业数据湖’时,核心关注点是,灵活应对企业所需的各种分析类型,这一点很重要。今天Pivotal宣布开放一些产品的源代码意味着,客户将能够更加灵活地向以洞察力为主导的经营模式转变。Pivotal能够提供ANSI兼容的SQL on Hadoop及内存分析功能,并能够按需改变分析方法,在结果导向而不是技术导向的今天,这种能力至关重要。”

Informatica公司数据集成与数据安全事业部高级副总裁AmitWalia:“我们长久以来一直坚信,减少障碍、用数据创造价值很重要。今天,Pivotal决定开放其数据库技术的源代码,这也是我们这个行业下一步的发展方向,因为这么做会增强大数据生态系统的发展势头,为业界增加更多选择。我们双方将继续紧密合作,为市场提供全面的数据管理解决方案。”

原文发布时间为:2015年3月4日
本文来自云栖社区合作伙伴至顶网,了解相关信息可以关注至顶网。
相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
3月前
|
数据可视化 大数据 定位技术
GIS:开源webgl大数据地图类库整理
GIS:开源webgl大数据地图类库整理
113 0
|
1月前
|
分布式计算 大数据 Serverless
云栖实录 | 开源大数据全面升级:Native 核心引擎、Serverless 化、湖仓架构引领云上大数据发展
在2024云栖大会开源大数据专场上,阿里云宣布推出实时计算Flink产品的新一代向量化流计算引擎Flash,该引擎100%兼容Apache Flink标准,性能提升5-10倍,助力企业降本增效。此外,EMR Serverless Spark产品启动商业化,提供全托管Serverless服务,性能提升300%,并支持弹性伸缩与按量付费。七猫免费小说也分享了其在云上数据仓库治理的成功实践。其次 Flink Forward Asia 2024 将于11月在上海举行,欢迎报名参加。
184 1
云栖实录 | 开源大数据全面升级:Native 核心引擎、Serverless 化、湖仓架构引领云上大数据发展
|
25天前
|
数据采集 分布式计算 OLAP
最佳实践:AnalyticDB在企业级大数据分析中的应用案例
【10月更文挑战第22天】在数字化转型的大潮中,企业对数据的依赖程度越来越高。如何高效地处理和分析海量数据,从中提取有价值的洞察,成为企业竞争力的关键。作为阿里云推出的一款实时OLAP数据库服务,AnalyticDB(ADB)凭借其强大的数据处理能力和亚秒级的查询响应时间,已经在多个行业和业务场景中得到了广泛应用。本文将从个人的角度出发,分享多个成功案例,展示AnalyticDB如何助力企业在广告投放效果分析、用户行为追踪、财务报表生成等领域实现高效的数据处理与洞察发现。
52 0
|
3月前
|
分布式计算 大数据 数据处理
【大数据管理新纪元】EMR Delta Lake 与 DLF 深度集成:解锁企业级数据湖的无限潜能!
【8月更文挑战第26天】随着大数据技术的发展,Apache Spark已成为处理大规模数据集的首选工具。亚马逊的EMR服务简化了Spark集群的搭建和运行流程。结合使用Delta Lake(提供ACID事务保证和数据版本控制)与DLF(加强数据访问控制及管理),可以显著提升数据湖的可靠性和性能。本文通过一个电商公司的具体案例展示了如何在EMR上部署集成Delta Lake和DLF的环境,以及这一集成方案带来的几大优势:增强的可靠性、细粒度访问控制、性能优化以及易于管理的特性。这为数据工程师提供了一个高效且灵活的数据湖平台,简化了数据湖的建设和维护工作。
60 1
|
3月前
|
机器学习/深度学习 监控 大数据
Serverless 应用的监控与调试问题之Flink在整个开源大数据生态中应该如何定位,差异化该如何保持
Serverless 应用的监控与调试问题之Flink在整个开源大数据生态中应该如何定位,差异化该如何保持
|
4月前
|
机器学习/深度学习 分布式计算 大数据
MaxCompute 2.0:开源系统的集成与创新
增强实时处理能力:进一步加强与Flink等实时处理框架的合作。 强化机器学习支持:提供更多内置的机器学习算法和工具。 增强数据治理功能:提供更完善的数据质量和安全治理方案。
|
1月前
|
存储 机器学习/深度学习 分布式计算
大数据技术——解锁数据的力量,引领未来趋势
【10月更文挑战第5天】大数据技术——解锁数据的力量,引领未来趋势
|
8天前
|
存储 分布式计算 数据挖掘
数据架构 ODPS 是什么?
数据架构 ODPS 是什么?
67 7
|
8天前
|
存储 分布式计算 大数据
大数据 优化数据读取
【11月更文挑战第4天】
23 2
|
21天前
|
数据采集 监控 数据管理
数据治理之道:大数据平台的搭建与数据质量管理
【10月更文挑战第26天】随着信息技术的发展,数据成为企业核心资源。本文探讨大数据平台的搭建与数据质量管理,包括选择合适架构、数据处理与分析能力、数据质量标准与监控机制、数据清洗与校验及元数据管理,为企业数据治理提供参考。
65 1
下一篇
无影云桌面