Teradata整合大数据分析架构

本文涉及的产品
可视分析地图(DataV-Atlas),3 个项目,100M 存储空间
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介:

本文讲的是Teradata整合大数据分析架构,全球领先的大数据分析和数据仓库解决方案厂商Teradata天睿公司(Teradata Corporation,美国纽约证券交易所交易代码: TDC)宣布,推出Teradata统一数据环境(Teradata® Unified Data Environment™)和统一数据架构(Unified Data Architecture™)。

  Teradata统一数据环境是一种框架,可帮助企业应对所有类型的数据和多种Teradata系统。Teredata统一数据架构运用来自Teradata、Teradata Aster以及开源Apache™ Hadoop的同类最佳且具有互补作用的技术,帮助企业用户在任何时间、用任何分析工具、就任何数据提出任何问题。

  Teradata统一数据环境和统一数据架构包括Teradata Viewpoint、Teradata连接器(Teradata Connector)和Teradata重要基础架构(Teradata Vital Infrastructure)等新软件以及新硬件Teredata数据仓库专用平台2700(Teradata Data Warehouse Appliance 2700)和Teradata Aster大数据分析专用平台(Teradata Aster Big Analytics Appliance)。

  凭借Teradata统一数据架构,企业现在可以在一个整合的、动态的Teradata统一环境(Teradata Unified Environment)中,部署、支持、管理和无缝访问所有数据。Teradata这种技术整合所产生的价值,远远超过了独立技术所能产生的总价值。


统一数据架构

  在建立有效统一的环境时,企业面临很多障碍,因为这类环境要应对新型数据和多种系统,所以难以部署和管理。由于没有一个有效统一的环境,所以很难及时获取业务洞察。为了满足这种需求,Teradata推出了统一数据架构。Teradata统一数据架构将多种技术整合到一个紧密结合的、透明的架构中,这些技术包括Aster SQL-MapReduce®、Aster SQL-H™和业内最佳的合作伙伴工具。这个环境由新的和现有的Teradata、Teradata Aster及Hadoop技术提供支持、优化、架构和交付。易于获得和使用这些强大的技术还有助于客户发现大数据中潜藏的洞察。

  Hortonworks公司首席执行官Rob Bearden表示:“Apache Hadoop已经从早期采用阶段逐步演变成主流技术,因此企业需要企业级的、统一的系统管理,并需要与现有分析工具紧密集成以确保成功。Teradata提供世界级的数据管理和分析功能,而Hortonworks数据平台(Hortonworks Data Platform)具备无与伦比的可靠性,二者结合可为企业提供真正统一的、高性能的大数据分析架构。”

  关键的新软件

  为了确保Teradata统一数据架构得到便捷的支持和管理,Teradata推出了一些新软件。

  Teradata Viewpoint是一款基于Web的系统管理和监控界面,该界面使Teradata及Teradata Aster数据库更易于管理。针对Hadoop的同样的管理功能将于2013年初提供。IT专业人员可用Teradata Viewpoint这个单一界面管理和监控整个Teradata统一数据架构。该界面提供一套全面的信息组件以监控多个系统,同时为所有用户提供有用的、对行动有指导意义的监控和管理信息。

  Teradata Hadoop连接器(Teradata Connector for Hadoop)支持Hortonworks和Cloudera。这款新的数据连接器产品允许透明、无缝地将数据移出和移入Hadoop平台,数据可以在Hadoop中存储和细化。现在有了两种领先的商用Hadoop版本可供客户选择:Hortonworks版和Cloudera版。

  Teradata重要基础架构管理整个Teradata统一数据架构,并为Teradata Aster数据库和Hadoop提供了新的支持功能。Teradata重要基础架构通过主动监控事件以及识别风险和系统故障来确保可靠性。该软件可在客户意识到之前,发现多达70%的事故,在管理Hadoop基础架构时,这种能力尤其重要。Teradata重要基础架构自动向Teradata客户服务代表发送提醒信息,之后这些客服代表会采取适当的行动。

  便捷、快速地部署

  Teradata统一数据架构可帮助客户管理并分析大量复杂数据。在Teradata统一数据架构内,Teradata提供两种针对工作负载的专用平台,以使数据分析系统的部署更简单、更快速、更经济实惠。

  Teradata数据仓库专用平台2700 – 为了更容易地提取数据中的价值,Teradata数据仓库专用平台2700提高了性能和数据加载能力,与前一版本相比,其性能提高了两倍,数据加载性能提高了4倍。Teradata数据仓库专用平台是一款强大的整合式一体机,用来优化Teradata数据库、多核英特尔处理器、压缩引擎、企业级磁盘驱动器和存储子系统,以提供高性能数据分析。这款强大的数据分析平台不需要设置,开机即可运行。该设备每机柜可配置存储从7 TB直至多达82 TB的非压缩用户数据。Teradata数据仓库设备2700将于2013年第一季度末上市。

  Teradata Aster大数据分析平台– 凭借Teradata Aster大数据分析平台,客户能以最快的速度从多种多样的大数据中获得价值非凡的洞察,这是业界首款具备这种能力的平台。该平台在单一整合式优化机柜中整合了Teradata Aster和Hadoop服务器。目前市场上的其他专用设备需要专家和特殊界面,才能在Hadoop中存取和分析数据,而Teradata Aster大数据分析平台则不需要,因而提供了一款真正企业就绪的解决方案。这个平台将Aster数据库、Aster SQL-MapReduce和Hortonworks提供的Apache Hadoop整合到单一界面中,以管理和分析结构化、非结构化及多种结构的数据。Teradata Aster大数据分析平台可以配置为,为Aster存储最多5 PB的非压缩用户数据,为Hadoop存储最多10 PB的非压缩用户数据。该平台现已开始供货。

  客户无需部署Teradata Aster大数据分析平台,就可以受益于开源Apache Hadoop,因为Apache Hadoop很容易用于灵活的Teradata统一数据环境。

  Gartner公司研究副总裁Mark Beyer表示:“大数据并非是要得到新技术,亦非是要利用旧有技术。大数据的目的是,找出建立一套公共指令和语义的方法,以管理完全不同的、无论是新的还是旧有的工程解决方案,就像这些解决方案在一个环境中一样,这样的管理模式将成为一种新的常规状态。”

  有很多业界实例显示,这些技术整合以后比任何一项单独的技术都更有价值。例如,医疗保健、通信、零售和金融服务等多种多样的行业都知道,在他们试图挖掘客户数据中潜藏的价值时,需要面对不同类型的数据和多种系统做出决策。通过整合来自所有渠道的客户行为数据,例如店面客流、呼叫中心使用、原始Web日志和在线交易等数据,企业可以详细、全面地了解真实情况。例如,如果发现了导致客户流失的行为模式,那么就能根据这种发现而采取行动,以留住可盈利的客户。当整合了所有来源的数据以供分析,并清晰地了解到哪些客户是可盈利的、这些客户可能的流失风险以及留住这些客户应采取的恰当行动以后,企业才能真正受益。今天,运用Teradata统一数据架构,这些事情都可以做到。Teradata统一数据架构在Hadoop中捕获、细化和存储详细的数据。然后,可以由Teradata Aster进行后续分析,以发现新的洞察。再后,由Teradata数据库提供所得到的信息,供整个企业使用。

  Teradata实验室总裁Scott Gnau表示:“Teradata统一数据架构成为一种新的常规状态,因为它为企业带来的价值高于独立的技术产生的总价值。Teradata统一数据架构采用同类最佳技术,无论企业用户分析什么类型的数据,都可以帮助企业用户快速、无缝地得到问题的答案。”

  定制的咨询服务

  当客户寻求以最佳方式统一和建立可持续的数据分析环境时,Teradata咨询服务部可为客户提供支持。Teradata咨询服务部充分利用世界各地的最佳实践,在为满足企业的业务需求而设计一个有效的数据仓库架构时,可提供所需信息并帮助确定应用及系统组件。因此,Teradata咨询服务部提供专门为特定企业而设计的定制解决方案,这使企业能从传统及新型数据中获取最大的价值。通过Teradata统一数据架构,Teradata成为第一个将所有类型的数据统一到单一架构中的公司,这使企业能从企业内部的方方面面获得洞察。Teradata咨询服务已向全球市场提供超过25年的软件及咨询服务,拥有丰富的经验。

作者:  李伟

来源: IT168

原文标题:Teradata整合大数据分析架构

相关实践学习
DataV Board用户界面概览
本实验带领用户熟悉DataV Board这款可视化产品的用户界面
阿里云实时数仓实战 - 项目介绍及架构设计
课程简介 1)学习搭建一个数据仓库的过程,理解数据在整个数仓架构的从采集、存储、计算、输出、展示的整个业务流程。 2)整个数仓体系完全搭建在阿里云架构上,理解并学会运用各个服务组件,了解各个组件之间如何配合联动。 3 )前置知识要求   课程大纲 第一章 了解数据仓库概念 初步了解数据仓库是干什么的 第二章 按照企业开发的标准去搭建一个数据仓库 数据仓库的需求是什么 架构 怎么选型怎么购买服务器 第三章 数据生成模块 用户形成数据的一个准备 按照企业的标准,准备了十一张用户行为表 方便使用 第四章 采集模块的搭建 购买阿里云服务器 安装 JDK 安装 Flume 第五章 用户行为数据仓库 严格按照企业的标准开发 第六章 搭建业务数仓理论基础和对表的分类同步 第七章 业务数仓的搭建  业务行为数仓效果图  
相关文章
|
18天前
|
存储 机器学习/深度学习 SQL
大数据处理与分析技术
大数据处理与分析技术
69 2
|
19天前
|
大数据
【赵渝强老师】大数据主从架构的单点故障
大数据体系架构中,核心组件采用主从架构,存在单点故障问题。为提高系统可用性,需实现高可用(HA)架构,通常借助ZooKeeper来实现。ZooKeeper提供配置维护、分布式同步等功能,确保集群稳定运行。下图展示了基于ZooKeeper的HDFS HA架构。
|
20天前
|
SQL 数据采集 分布式计算
【赵渝强老师】基于大数据组件的平台架构
本文介绍了大数据平台的总体架构及各层的功能。大数据平台架构分为五层:数据源层、数据采集层、大数据平台层、数据仓库层和应用层。其中,大数据平台层为核心,负责数据的存储和计算,支持离线和实时数据处理。数据仓库层则基于大数据平台构建数据模型,应用层则利用这些模型实现具体的应用场景。文中还提供了Lambda和Kappa架构的视频讲解。
【赵渝强老师】基于大数据组件的平台架构
|
7天前
|
机器学习/深度学习 存储 大数据
在大数据时代,高维数据处理成为难题,主成分分析(PCA)作为一种有效的数据降维技术,通过线性变换将数据投影到新的坐标系
在大数据时代,高维数据处理成为难题,主成分分析(PCA)作为一种有效的数据降维技术,通过线性变换将数据投影到新的坐标系,保留最大方差信息,实现数据压缩、去噪及可视化。本文详解PCA原理、步骤及其Python实现,探讨其在图像压缩、特征提取等领域的应用,并指出使用时的注意事项,旨在帮助读者掌握这一强大工具。
26 4
|
26天前
|
存储 SQL Apache
Apache Doris 开源最顶级基于MPP架构的高性能实时分析数据库
Apache Doris 是一个基于 MPP 架构的高性能实时分析数据库,以其极高的速度和易用性著称。它支持高并发点查询和复杂分析场景,适用于报表分析、即席查询、数据仓库和数据湖查询加速等。最新发布的 2.0.2 版本在性能、稳定性和多租户支持方面有显著提升。社区活跃,已广泛应用于电商、广告、用户行为分析等领域。
Apache Doris 开源最顶级基于MPP架构的高性能实时分析数据库
|
9天前
|
机器学习/深度学习 分布式计算 算法
【大数据分析&机器学习】分布式机器学习
本文主要介绍分布式机器学习基础知识,并介绍主流的分布式机器学习框架,结合实例介绍一些机器学习算法。
62 5
|
20天前
|
存储 监控 数据挖掘
【Clikhouse 探秘】ClickHouse 物化视图:加速大数据分析的新利器
ClickHouse 的物化视图是一种特殊表,通过预先计算并存储查询结果,显著提高查询性能,减少资源消耗,适用于实时报表、日志分析、用户行为分析、金融数据分析和物联网数据分析等场景。物化视图的创建、数据插入、更新和一致性保证通过事务机制实现。
84 14
|
2月前
|
存储 机器学习/深度学习 分布式计算
大数据技术——解锁数据的力量,引领未来趋势
【10月更文挑战第5天】大数据技术——解锁数据的力量,引领未来趋势
|
16天前
|
存储 分布式计算 数据挖掘
数据架构 ODPS 是什么?
数据架构 ODPS 是什么?
128 7
|
16天前
|
存储 分布式计算 大数据
大数据 优化数据读取
【11月更文挑战第4天】
32 2