EnterpriseDB剑指Hadoop:优化数据处理

本文涉及的产品
云原生数据库 PolarDB MySQL 版,Serverless 5000PCU 100GB
云原生数据库 PolarDB PostgreSQL 版,企业版 4核16GB
推荐场景:
HTAP混合负载
云原生数据库 PolarDB MySQL 版,通用型 2核4GB 50GB
简介:

世界上领先的供应商EnterpriseDB正式发布了Hadoop的Postgres Plus(R) Connector。作为PostgreSQL衍生版本的EnterpriseDB却异军突起,近期频繁的市场动作无疑让人眼前一亮。

开源数据库:EnterpriseDB异军突起

EnterpriseDB是一家基于开源数据库PostgreSQL,提供增值服务的开源服务供应商。目前,MySQL、PostgreSQL、EnterpriseDB是全球三大开源数据库,而PostgreSQL是目前最为流行的开源数据库之一。与MySQL侧重在个人和轻量型数据库应用不同,PostgreSQL是一种面向企业级的数据库产品。EnterpriseDB所做的工作就是在PostgreSQL的基础上,集成各种组件和实用的工具,从而为PostgreSQL增加了一些高级特性,以满足各种高级需求。

Image

EnterpriseDB有三种产品,分别是基础版、标准版和企业版。其增值主要体现在后两个版本上。标准版中提供了客户端连接驱动、连接池、地理信息支持、自动软件更新; 企业版直接支持Oracle数据库的数据类型、SQL语法、PL/SQL、触发器、序列、自定义包等。针对Oracle设计的应用几乎不需修改即可在EnterpriseDB上快速运行,并且提供一键式迁移工具EnterpriseDB Migration Studio来简化数据库迁移过程,并生成完整的迁移报告,使之更适合高性能、高数据量、企业级功能数据库的核心应用。

EnterpriseDB的产品另一个非常重要的特点是与Oracle数据库的兼容。事实上,保持与Oracle数据库的兼容性、让用户可以一键式地实现从Oracle数据库向EnterpriseDB的数据库迁移,已经成了 EnterpriseDB的一个非常重要的市场战略,而究其根源可能是想撬动Oracle帝国的根基,很显然,它把目标瞄准了Oracle数据库的潜在客户。

EnterpriseDB发布Postgres Plus(R) Connector: 剑指Hadoop

EnterpriseDB发布了基于Hadoop的Postgres Plus(R) Connector。该连接器允许访问Postgres Plus(R) Advanced Server (PPAS)以及PostgreSQL数据库中的大量数据,并支持在Hadoop集群上大量处理和分析数据。Hadoop的Postgres Plus(R) Connector允许程序员使用它们熟悉的MapReduce框架来处理基于SQL的批量数据。

Image 

Hadoop是一个开源分布式的处理框架,集成了大量重要的应用程序,包括分布式文本搜索、web访问日志统计等等。Hadoop主要由三部分组成:HDFS(Hadoop Distributed File System),MapReduce与Hbase。





本文转自 taojin1240 51CTO博客,原文链接:http://blog.51cto.com/taotao1240/713485,如需转载请自行联系原作者

相关实践学习
使用PolarDB和ECS搭建门户网站
本场景主要介绍基于PolarDB和ECS实现搭建门户网站。
阿里云数据库产品家族及特性
阿里云智能数据库产品团队一直致力于不断健全产品体系,提升产品性能,打磨产品功能,从而帮助客户实现更加极致的弹性能力、具备更强的扩展能力、并利用云设施进一步降低企业成本。以云原生+分布式为核心技术抓手,打造以自研的在线事务型(OLTP)数据库Polar DB和在线分析型(OLAP)数据库Analytic DB为代表的新一代企业级云原生数据库产品体系, 结合NoSQL数据库、数据库生态工具、云原生智能化数据库管控平台,为阿里巴巴经济体以及各个行业的企业客户和开发者提供从公共云到混合云再到私有云的完整解决方案,提供基于云基础设施进行数据从处理、到存储、再到计算与分析的一体化解决方案。本节课带你了解阿里云数据库产品家族及特性。
目录
相关文章
|
2月前
|
存储 分布式计算 Hadoop
Hadoop:开启大规模数据处理的新时代
在当今数字化时代,大规模数据处理成为企业和组织不可或缺的一环。Hadoop作为一个强大的分布式计算框架,为我们提供了处理海量数据的能力,它的概念与实践不仅改变了数据处理的方式,更为未来数据驱动型决策提供了无限可能。本文将深入探讨Hadoop的核心概念、架构以及实践应用,带您进入大数据时代的新篇章。
|
1月前
|
存储 分布式计算 算法
|
SQL 存储 缓存
Hadoop-Impala优化十大指导原则和最佳实践(二)
简介: 以下是性能准则和最佳做法。您可以使用在规划过程中实验,和hadoop集群一起进行impala的性能调整。所有这些信息也可在文档的其他地方更详细的impala文档;以下是优化的方法措施,强调优化调优技术提供最高的投资回报
1404 0
|
14天前
|
分布式计算 Hadoop Java
优化大数据处理:Java与Hadoop生态系统集成
优化大数据处理:Java与Hadoop生态系统集成
|
27天前
|
存储 分布式计算 资源调度
如何优化Hadoop集群的内存使用?
【6月更文挑战第18天】如何优化Hadoop集群的内存使用?
34 6
|
1月前
|
存储 分布式计算 固态存储
Hadoop性能优化硬件和网络优化
【6月更文挑战第7天】
28 3
|
1月前
|
分布式计算 资源调度 监控
Hadoop性能优化优化元数据管理
【6月更文挑战第6天】
17 2
|
12天前
|
分布式计算 Hadoop 大数据
优化大数据处理:Java与Hadoop生态系统集成
优化大数据处理:Java与Hadoop生态系统集成
|
1月前
|
分布式计算 资源调度 监控
【大数据】Hadoop 2.X和1.X升级优化对比
【大数据】Hadoop 2.X和1.X升级优化对比
36 0
|
2月前
|
存储 分布式计算 Hadoop
Hadoop 集群小文件归档 HAR、小文件优化 Uber 模式
该文介绍了Hadoop中两种小文件管理策略。首先,通过Hadoop Archive (HAR)将小文件归档成大文件以减少存储和管理开销。操作包括使用`hadoop archive`命令进行归档和解档。其次,文章讨论了小文件优化的Uber模式,这种模式在同一JVM中运行所有MapReduce任务以提高效率和局部性,但可能引发单点故障和资源限制问题。启用Uber模式需在`mapred-site.xml`配置文件中设置相关参数。文中还提供了使用WordCount例子验证Uber模式配置的步骤。