甲骨文Thomas:大数据下的共存与集成

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介:
本文讲的是 甲骨文Thomas:大数据下的共存与集成, 随着电影碟中谍4在中国的热映,汤姆克鲁兹这个不老的神话又出现在电影荧幕,而就在2月末一个晴朗的下午,数据库届也迎来了“阿汤哥”,一位在全世界范围内拥有着众多粉丝的Oracle技术大师Thomas Kyte。

  Thomas Kyte(以下简称Tom)是AskTom网站背后的老大,目前是Oracle公司核心技术集团的副总裁,从Oracle 7.0.9版本开始就一直任职于Oracle公司,通过自身20多年的经验,一直致力于和Oracle数据库用户共同设计和构建系统,并对系统进行重构和调优。就在访华的这段期间,他接受了为数不多的几家中国媒体的采访。他说:“我想和大家谈谈Oracle的数据库产品战略。”
 


图 Oracle公司核心技术集团的副总裁Thomas Kyte

  不断整合 Oracle持续改进

  近几年,数据库市场成几何级的增长,各种数据库软件市场规模不断扩大。面对需求如此强劲的市场, Oracle发展依然强劲,从Gartner发布的2010年度关系数据库市场的调查报告显示在RDBMS市场,Oracle的市场份额已经占到48.1%,位居第一位,其市场份额超过了之后的五个竞争对手的总和。在2011年,Oracle依然保持着这种增长势头。

  面对越来越激烈的竞争,Tom表示,甲骨文一贯的战略就是不断把新技术吸收并整合到现有的数据库产品当中,保持产品的灵活性。他谈到,Oracle最初做数据库的时候只有三种简单的数据类型,通过把不同的数据类型整合到一个数据库中,用户可以使用一种Oracle数据库来处理几种数据类型;到了九十年代初,Oracle数据库整合了数据挖掘和分析技术;之后,Oracle又添加了OPS并行服务器,形成真正应用集群(RAC)。

  继数据库产品的成功,Oracle Exadata把数据库软件和存储系统以一种非常优化的方式整合在一起打造出的一体化的系统引发了一场技术革命。

  打击对手 MySQL成企业级利器

  甲骨文公司正式宣布收购SUN后,MySQL等产品未来的命运一直受到极大关注。甲骨文没有失信于人,且继续发展与巩固MySQL数据库产品的地位,同时把MySQL数据库产品对市场的战火正式引向竞争对手之一微软的SQL Server数据库产品。

  2010年12月,甲骨文发布了新版本的MySQL 5.5,使用户能跨Windows、Linux、Oracle Solaris等多种操作环境改进Web应用的性能和可扩展性,并且在自身的旗舰数据库产品中添加了开源SQL Lite的支持,以帮助使用其他平台,如Windows的企业和技术人员,降低学习成本,从而更加符合和吸引这些平台的企业和技术人员。同时,若把Oracle数据库支持的数据服务,迁移到MySQL数据库平台上,还可以为企业节约大量资金。

  Tom表示,MySQL在Oracle中地位非常重要。新版本的MySQL引进了集群功能,提升到了企业级的可用性、可靠性和可扩展性。目前MySQL和Oracle数据库已经可以做到相互兼容,拥有相同的数据类型和API,二者可以进行无缝迁移。

      共存和集成 Oracle的大数据策略

  现在大数据业务已经得到大多数技术人员和企业决策者的认同。但是数据量的激增确实是一个棘手的问题,对于任何重要的数据库而言,分布式必不可少。企业目前可以采用分布式计算或者进行扩容,还可采用各种模式并围绕开源技术进行构建,比如Hadoop,MapReduce和NoSQL数据存储技术。

  Tom表示,甲骨文最早于1985年就率先推出了Oracle Version 5,支持分布式计算。如今面临的问题是,如何把上百亿的信息压缩和整合到几百万级,然后将这些信息放在一个结构化数据库中更方便的进行分析。目前,Oracle的很多工具都可以把这个架构中的数据无缝的放入或或取出,从而更方便的使用。


作者:胡铭娅

来源: IT168

原文标题:甲骨文Thomas:大数据下的共存与集成

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
1月前
|
分布式计算 大数据 Apache
ClickHouse与大数据生态集成:Spark & Flink 实战
【10月更文挑战第26天】在当今这个数据爆炸的时代,能够高效地处理和分析海量数据成为了企业和组织提升竞争力的关键。作为一款高性能的列式数据库系统,ClickHouse 在大数据分析领域展现出了卓越的能力。然而,为了充分利用ClickHouse的优势,将其与现有的大数据处理框架(如Apache Spark和Apache Flink)进行集成变得尤为重要。本文将从我个人的角度出发,探讨如何通过这些技术的结合,实现对大规模数据的实时处理和分析。
124 2
ClickHouse与大数据生态集成:Spark & Flink 实战
|
4月前
|
分布式计算 DataWorks 关系型数据库
MaxCompute 生态系统中的数据集成工具
【8月更文第31天】在大数据时代,数据集成对于构建高效的数据处理流水线至关重要。阿里云的 MaxCompute 是一个用于处理大规模数据集的服务平台,它提供了强大的计算能力和丰富的生态系统工具来帮助用户管理和处理数据。本文将详细介绍如何使用 DataWorks 这样的工具将 MaxCompute 整合到整个数据处理流程中,以便更有效地管理数据生命周期。
150 0
|
1月前
|
分布式计算 大数据 OLAP
AnalyticDB与大数据生态集成:Spark & Flink
【10月更文挑战第25天】在大数据时代,实时数据处理和分析变得越来越重要。AnalyticDB(ADB)是阿里云推出的一款完全托管的实时数据仓库服务,支持PB级数据的实时分析。为了充分发挥AnalyticDB的潜力,将其与大数据处理工具如Apache Spark和Apache Flink集成是非常必要的。本文将从我个人的角度出发,分享如何将AnalyticDB与Spark和Flink集成,构建端到端的大数据处理流水线,实现数据的实时分析和处理。
65 1
|
4月前
|
消息中间件 分布式计算 大数据
RabbitMQ与大数据平台的集成
【8月更文第28天】在现代的大数据处理架构中,消息队列作为数据传输的关键组件扮演着重要的角色。RabbitMQ 是一个开源的消息代理软件,它支持多种消息协议,能够为分布式系统提供可靠的消息传递服务。本篇文章将探讨如何使用 RabbitMQ 与 Hadoop 和 Spark 进行集成,以实现高效的数据处理和分析。
49 1
|
4月前
|
分布式计算 大数据 数据处理
【大数据管理新纪元】EMR Delta Lake 与 DLF 深度集成:解锁企业级数据湖的无限潜能!
【8月更文挑战第26天】随着大数据技术的发展,Apache Spark已成为处理大规模数据集的首选工具。亚马逊的EMR服务简化了Spark集群的搭建和运行流程。结合使用Delta Lake(提供ACID事务保证和数据版本控制)与DLF(加强数据访问控制及管理),可以显著提升数据湖的可靠性和性能。本文通过一个电商公司的具体案例展示了如何在EMR上部署集成Delta Lake和DLF的环境,以及这一集成方案带来的几大优势:增强的可靠性、细粒度访问控制、性能优化以及易于管理的特性。这为数据工程师提供了一个高效且灵活的数据湖平台,简化了数据湖的建设和维护工作。
64 1
|
4月前
|
机器学习/深度学习 设计模式 人工智能
面向对象方法在AIGC和大数据集成项目中的应用
【8月更文第12天】随着人工智能生成内容(AIGC)和大数据技术的快速发展,企业面临着前所未有的挑战和机遇。AIGC技术能够自动产生高质量的内容,而大数据技术则能提供海量数据的支持,两者的结合为企业提供了强大的竞争优势。然而,要充分利用这些技术,就需要构建一个既能处理大规模数据又能高效集成机器学习模型的集成框架。面向对象编程(OOP)以其封装性、继承性和多态性等特点,在构建这样的复杂系统中扮演着至关重要的角色。
73 3
|
5月前
|
分布式计算 DataWorks 调度
DataWorks产品使用合集之在使用MaxCompute进行数据集成同步到OSS时,出现表名和OSS文件名不一致且多了后缀,该如何处理
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
|
5月前
|
数据采集 分布式计算 大数据
MaxCompute产品使用合集之数据集成中进行数据抽取时,是否可以定义使用和源数据库一样的字符集进行抽取
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
5月前
|
机器学习/深度学习 分布式计算 大数据
MaxCompute 2.0:开源系统的集成与创新
增强实时处理能力:进一步加强与Flink等实时处理框架的合作。 强化机器学习支持:提供更多内置的机器学习算法和工具。 增强数据治理功能:提供更完善的数据质量和安全治理方案。
|
5月前
|
分布式计算 Hadoop 大数据
优化大数据处理:Java与Hadoop生态系统集成
优化大数据处理:Java与Hadoop生态系统集成