Oracle+英特尔,数据处理效率提升不止一点点

简介: 英特尔宣布已于近日开始生产的第三代英特尔® 至强® 可扩展处理器(代号“Ice Lake”)将于2021年第一季度实现规模量产。在此积极影响下,不仅大数据产业的底层架构有望加速升级,还能帮助头部企业更好地突破发展瓶颈。

自动驾驶、智能制造、物联网……伴随物联网时代的全面到来,巨量数据如潮水般袭来,金矿只有经历采掘、清洗、提纯等一系列工序后才能成为黄金,数据必须经过治理才能发挥出价值。谈到数据治理,有一个厂商不得不提,它就是Oracle,数据库领域的霸主。


不可否认,Oracle近两年遭遇了一些挑战。面对急剧增长的数据量,日益加快的数据增长速度,作为传统关系型数据库的代表,在数据库系统可扩展性极限方面、数据处理能力和内存容量支持上,Oracle遇到了一些瓶颈。


微信图片_20220104214958.jpg

但霸主的实力不是闹的,当前,Oracle最新的Database 19c搭配英特尔最新的至强可扩展处理器和傲腾持久内存,已经能给用户一个与之前完全不同的数据处理体验,不仅仅是性能的提升,而且还能降低总体拥有成本。心动吗?


数据暴增,Oracle的应对


毫无疑问,我们已经进入了大数据时代,数据量剧增是不争的事实。来自著名分析机构IDC的数据显示,“全球超过一半数据创建于过去两年”。


在这样的时代巨变面前,业界已经给出了一个一致的答案,那就是必须改变IT基础设施,才能适应新时代的需求。在 Enterprise Strategy Group (ESG) 进行的一项研究中,81%的受访者认为如果不接受IT转型,公司将失去竞争力。


怎么变?底层架构要变、数据处理方式要变。为此,Oracle Database19c在联机分析处理 (OLAP) 和联机事务处理 (OLTP) 所需要的功能性和灵活性方面下了很多功夫。比如:

多租户架构方面,Oracle独特的多租户数据库架构,能够简化数据库整合工作,实现基于模式的高密度整合,同时无需更改现有应用。


性能方面,除了性能调优和问题诊断外,Oracle Database 19c还增强了SQL查询和数据优化,能够为运营、分析和混合工作负载提供数据库级别的性能。


除此之外,在可用性、安全性、数据仓库、应用开发方面,Oracle Database19c都进行了诸多改善,为的就是更好适应数据爆炸的时代。


事实上,Oracle Database 19c不仅仅是数据库,还是一个完整的平台和工具箱,适用于企业内部业务应用以及出色的客户关系管理 (CRM) 和企业资源规划 (ERP) 业务解决方案,包括 JD Edwards、PeopleSoft和Oracle Financial。




所以,是时候考虑升级到Oracle Database 19c了。


搭载英特尔,更快更稳


与此同时,升级的还应该有底层的架构,包括处理器、内存等,只有这样,才能充分展现出OracleDatabase 19c的数据处理效率。因为最新英特尔至强可扩展处理器和傲腾持久内存相较上一代提升的可不止一点点。比如:更高性能的内核、更高的内存容量、更低的总体拥有成本、更强的性能优化。


微信图片_20220104215038.jpg


这里着重讲一下内存。数据处理效率想要越高,处理器和内存就要越快越大,目前情况下,内存想要变大,成本是以指数级提升的,而傲腾最大的价值在于能够实现平价的内存容量提升,所以对于需要大容量内存进行计算的企业来说,傲腾简直就是福音。截至当前,已经有很多具备前瞻性的客户部署使用了傲腾持久内存,反馈良好。

聚焦Oracle,尽管目前还不支持傲腾的App Direct模式,在该模式下,内存可以持久保存数据,换句话说,在进行内存计算时,不担心掉电等意外故障,数据处理效率在该模式下会更高。但是也有办法让Oracle应用傲腾的App Direct模式,比如利用NetApp MAX Data就能使用该模式,而且Oracle未来也会支持App Direct模式,让客户一直从中受益。


行不行,比比就知道


耳听为虚眼见为实。为了证明Oracle Database 19c+英特尔至强可扩展处理器和傲腾持久内存组合的强大,英特尔联合Oracle进行了详细的对照测试。测试中,英特尔针对Oracle环境确定了三种参考配置,用来模拟不同的企业规模和需求。其中:


  • 小型:一个经济高效的现代化平台,适用于数据库规模小于1.5 TB、吞吐量需求最高为每分钟 300 万条事务 (TPM) 的情况


  • 中型:一个高性能解决方案,适用于数据库规模小于 1.5 TB、吞吐量需求最高为每分钟 500 万条事务 (TPM) 的情况


  • 大型:面向要求极为苛刻的数据分析工作负载的解决方案,适用于数据库规模超过 1.5 TB、吞吐量需求最高为每分钟 700 万条事务 (TPM) 的情况

 

具体配置详见下图。需要强调的是,三种配置下,英特尔所进行的对比测试,不只有CPU的对照,还有通过NetApp MAX Data引入傲腾持久内存情况下的对照测试。


微信图片_20220104215117.jpg


Tips:


NetApp MAX Data 是一款用于在计算节点上自动分层的文件系统解决方案,可以使Oracle 软件充分利用傲腾持久内存的 App Direct 模式。与三个参考配置中使用的 2LM 模式不同,采用 App Direct 模式,傲腾持久内存上存储的数据在整个电源周期内都能持久保存。这样一来,就不需要将数据从较慢存储介质加载到 DRAM 中,从而加快了运行效率。


成绩能够说明一切


实际测试中,英特尔利用行业标准 HammerDB 基准测试在各类处理器上进行了吞吐量 (TPM) 测试,并将当前的英特尔处理器与前代产品进行了比较。由于处理器的内核数量是影响 Oracle 用户许可成本的重要因素,因此比较的主要性能指标是每核吞吐量,而不是每处理器吞吐量。


小型配置下,英特尔对当前的小型配置系统与一系列较旧的八核英特尔系统做了对比测试。测试结果如下,看得出,每一代产品革新,性能都有不同程度的提升。


微信图片_20220104215158.jpg


中型配置下,英特尔对当前的中型配置系统与使用四年的英特尔系统做了对比测试。测试结果如下图,与使用四年的英特尔系统相比,中型配置系统的每核性能提高了60%。


微信图片_20220104215202.jpg


大型配置下,英特尔对当前的大型配置系统与使用四年的英特尔系统做了对比测试。测试结果如下,与使用四年的英特尔系统相比,大型配置系统的每核性能提高了50%。


微信图片_20220104215229.jpg


加上傲腾,性能大不同


以上是未添加傲腾持久内存的对比测试结果,看得出,仅处理器的提升就能使Oracle的性能有质的飞跃,那加上傲腾持久内存呢?英特尔同样做了详尽的对比测试。


测试中,在向运行 Oracle Database 的系统添加1.5 TB的英特尔傲腾持久内存后,系统性能得到了显著提升。如下图,性能提升达到12倍。


微信图片_20220104215321.jpg


为了进一步挖掘英特尔傲腾持久内存的优势,英特尔在测试中使用NetAppMAXData进行性能改进。


测试中,英特尔对有无NetApp MAX Data和英特尔傲腾持久内存时Oracle Database 19c的性能进行对比。测试环境使用 384 GBDRAM 和 Linux XFS 文件系统的基准系统与使用NetApp MAX Data和额外1TB英特尔傲腾持久内存的系统进行了对比,并使用HammerDB 来测量 Oracle Database 裸机实例和虚拟化实例的吞吐量。


下图是200 个用户的Oracle 裸机系统和虚拟化系统的测试结果,添加 NetApp MAX Data和英特尔傲腾持久内存后,裸机系统的性能提升了多达1.9倍,虚拟化系统的性能提升了多达3.16倍。


微信图片_20220104215341.jpg微信图片_20220104215346.jpg


显而易见,英特尔全新架构配合Oracle Database 19c能给用户带来全新数据处理体验,这正是大数据时代用户急切需要的。其实不仅是Oracle,包括Spark、MongoDB、Cassandra、Aerospike等众多大数据平台在内,英特尔至强可扩展处理器及傲腾持久内存都能帮助实现很好的性能提升。


这也就难怪为什么傲腾刚推出来才不久,市场接受程度却非常高,说到底,傲腾又能提性能,又能省钱。因此,应对大数据时代,升级数据处理平台还不够,底层架构也该升级了。 





相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
Oracle 关系型数据库 数据处理
oracle学习67-oracle之数据处理之约束1
oracle学习67-oracle之数据处理之约束1
70 0
oracle学习67-oracle之数据处理之约束1
|
Oracle 关系型数据库 数据处理
oracle学习68-oracle之数据处理之课后练习
oracle学习68-oracle之数据处理之课后练习
56 0
|
Oracle 关系型数据库 数据处理
oracle学习69-oracle之数据处理2
oracle学习69-oracle之数据处理2
61 0
oracle学习69-oracle之数据处理2
|
Oracle 关系型数据库 数据处理
oracle学习70-oracle之数据处理
oracle学习70-oracle之数据处理
72 0
oracle学习70-oracle之数据处理
|
Oracle 关系型数据库 数据处理
oracle学习65-oracle之数据处理之视图练习
oracle学习65-oracle之数据处理之视图练习
89 0
|
Oracle 关系型数据库 数据处理
oracle学习64-oracle之数据处理之其他数据库对象
oracle学习64-oracle之数据处理之其他数据库对象
80 0
oracle学习64-oracle之数据处理之其他数据库对象
|
Oracle 关系型数据库 数据处理
oracle学习63-oracle之数据处理之其他数据库对象练习
oracle学习63-oracle之数据处理之其他数据库对象练习
71 0
|
SQL Oracle 关系型数据库
Oracle数据处理
SQL> /*数据库中语言:      EMPNO ENAME      JOB              MGR HIREDATE         SAL       COMM     DEPTNO                                   ---------- ---------- --------- ---------- -----------
1218 0
|
11天前
|
DataWorks Oracle 关系型数据库
DataWorks操作报错合集之尝试从Oracle数据库同步数据到TDSQL的PG版本,并遇到了与RAW字段相关的语法错误,该怎么处理
DataWorks是阿里云提供的一站式大数据开发与治理平台,支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。
29 0
|
2天前
|
存储 Oracle 关系型数据库
oracle 数据库 迁移 mysql数据库
将 Oracle 数据库迁移到 MySQL 是一项复杂的任务,因为这两种数据库管理系统具有不同的架构、语法和功能。
12 0