Teradata整合大数据分析架构

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

本文讲的是Teradata整合大数据分析架构,全球领先的大数据分析和数据仓库解决方案厂商Teradata天睿公司(Teradata Corporation,美国纽约证券交易所交易代码: TDC)宣布,推出Teradata统一数据环境(Teradata® Unified Data Environment™)和统一数据架构(Unified Data Architecture™)。

  Teradata统一数据环境是一种框架,可帮助企业应对所有类型的数据和多种Teradata系统。Teredata统一数据架构运用来自Teradata、Teradata Aster以及开源Apache™ Hadoop的同类最佳且具有互补作用的技术,帮助企业用户在任何时间、用任何分析工具、就任何数据提出任何问题。

  Teradata统一数据环境和统一数据架构包括Teradata Viewpoint、Teradata连接器(Teradata Connector)和Teradata重要基础架构(Teradata Vital Infrastructure)等新软件以及新硬件Teredata数据仓库专用平台2700(Teradata Data Warehouse Appliance 2700)和Teradata Aster大数据分析专用平台(Teradata Aster Big Analytics Appliance)。

  凭借Teradata统一数据架构,企业现在可以在一个整合的、动态的Teradata统一环境(Teradata Unified Environment)中,部署、支持、管理和无缝访问所有数据。Teradata这种技术整合所产生的价值,远远超过了独立技术所能产生的总价值。


统一数据架构

  在建立有效统一的环境时,企业面临很多障碍,因为这类环境要应对新型数据和多种系统,所以难以部署和管理。由于没有一个有效统一的环境,所以很难及时获取业务洞察。为了满足这种需求,Teradata推出了统一数据架构。Teradata统一数据架构将多种技术整合到一个紧密结合的、透明的架构中,这些技术包括Aster SQL-MapReduce®、Aster SQL-H™和业内最佳的合作伙伴工具。这个环境由新的和现有的Teradata、Teradata Aster及Hadoop技术提供支持、优化、架构和交付。易于获得和使用这些强大的技术还有助于客户发现大数据中潜藏的洞察。

  Hortonworks公司首席执行官Rob Bearden表示:“Apache Hadoop已经从早期采用阶段逐步演变成主流技术,因此企业需要企业级的、统一的系统管理,并需要与现有分析工具紧密集成以确保成功。Teradata提供世界级的数据管理和分析功能,而Hortonworks数据平台(Hortonworks Data Platform)具备无与伦比的可靠性,二者结合可为企业提供真正统一的、高性能的大数据分析架构。”

  关键的新软件

  为了确保Teradata统一数据架构得到便捷的支持和管理,Teradata推出了一些新软件。

  Teradata Viewpoint是一款基于Web的系统管理和监控界面,该界面使Teradata及Teradata Aster数据库更易于管理。针对Hadoop的同样的管理功能将于2013年初提供。IT专业人员可用Teradata Viewpoint这个单一界面管理和监控整个Teradata统一数据架构。该界面提供一套全面的信息组件以监控多个系统,同时为所有用户提供有用的、对行动有指导意义的监控和管理信息。

  Teradata Hadoop连接器(Teradata Connector for Hadoop)支持Hortonworks和Cloudera。这款新的数据连接器产品允许透明、无缝地将数据移出和移入Hadoop平台,数据可以在Hadoop中存储和细化。现在有了两种领先的商用Hadoop版本可供客户选择:Hortonworks版和Cloudera版。

  Teradata重要基础架构管理整个Teradata统一数据架构,并为Teradata Aster数据库和Hadoop提供了新的支持功能。Teradata重要基础架构通过主动监控事件以及识别风险和系统故障来确保可靠性。该软件可在客户意识到之前,发现多达70%的事故,在管理Hadoop基础架构时,这种能力尤其重要。Teradata重要基础架构自动向Teradata客户服务代表发送提醒信息,之后这些客服代表会采取适当的行动。

  便捷、快速地部署

  Teradata统一数据架构可帮助客户管理并分析大量复杂数据。在Teradata统一数据架构内,Teradata提供两种针对工作负载的专用平台,以使数据分析系统的部署更简单、更快速、更经济实惠。

  Teradata数据仓库专用平台2700 – 为了更容易地提取数据中的价值,Teradata数据仓库专用平台2700提高了性能和数据加载能力,与前一版本相比,其性能提高了两倍,数据加载性能提高了4倍。Teradata数据仓库专用平台是一款强大的整合式一体机,用来优化Teradata数据库、多核英特尔处理器、压缩引擎、企业级磁盘驱动器和存储子系统,以提供高性能数据分析。这款强大的数据分析平台不需要设置,开机即可运行。该设备每机柜可配置存储从7 TB直至多达82 TB的非压缩用户数据。Teradata数据仓库设备2700将于2013年第一季度末上市。

  Teradata Aster大数据分析平台– 凭借Teradata Aster大数据分析平台,客户能以最快的速度从多种多样的大数据中获得价值非凡的洞察,这是业界首款具备这种能力的平台。该平台在单一整合式优化机柜中整合了Teradata Aster和Hadoop服务器。目前市场上的其他专用设备需要专家和特殊界面,才能在Hadoop中存取和分析数据,而Teradata Aster大数据分析平台则不需要,因而提供了一款真正企业就绪的解决方案。这个平台将Aster数据库、Aster SQL-MapReduce和Hortonworks提供的Apache Hadoop整合到单一界面中,以管理和分析结构化、非结构化及多种结构的数据。Teradata Aster大数据分析平台可以配置为,为Aster存储最多5 PB的非压缩用户数据,为Hadoop存储最多10 PB的非压缩用户数据。该平台现已开始供货。

  客户无需部署Teradata Aster大数据分析平台,就可以受益于开源Apache Hadoop,因为Apache Hadoop很容易用于灵活的Teradata统一数据环境。

  Gartner公司研究副总裁Mark Beyer表示:“大数据并非是要得到新技术,亦非是要利用旧有技术。大数据的目的是,找出建立一套公共指令和语义的方法,以管理完全不同的、无论是新的还是旧有的工程解决方案,就像这些解决方案在一个环境中一样,这样的管理模式将成为一种新的常规状态。”

  有很多业界实例显示,这些技术整合以后比任何一项单独的技术都更有价值。例如,医疗保健、通信、零售和金融服务等多种多样的行业都知道,在他们试图挖掘客户数据中潜藏的价值时,需要面对不同类型的数据和多种系统做出决策。通过整合来自所有渠道的客户行为数据,例如店面客流、呼叫中心使用、原始Web日志和在线交易等数据,企业可以详细、全面地了解真实情况。例如,如果发现了导致客户流失的行为模式,那么就能根据这种发现而采取行动,以留住可盈利的客户。当整合了所有来源的数据以供分析,并清晰地了解到哪些客户是可盈利的、这些客户可能的流失风险以及留住这些客户应采取的恰当行动以后,企业才能真正受益。今天,运用Teradata统一数据架构,这些事情都可以做到。Teradata统一数据架构在Hadoop中捕获、细化和存储详细的数据。然后,可以由Teradata Aster进行后续分析,以发现新的洞察。再后,由Teradata数据库提供所得到的信息,供整个企业使用。

  Teradata实验室总裁Scott Gnau表示:“Teradata统一数据架构成为一种新的常规状态,因为它为企业带来的价值高于独立的技术产生的总价值。Teradata统一数据架构采用同类最佳技术,无论企业用户分析什么类型的数据,都可以帮助企业用户快速、无缝地得到问题的答案。”

  定制的咨询服务

  当客户寻求以最佳方式统一和建立可持续的数据分析环境时,Teradata咨询服务部可为客户提供支持。Teradata咨询服务部充分利用世界各地的最佳实践,在为满足企业的业务需求而设计一个有效的数据仓库架构时,可提供所需信息并帮助确定应用及系统组件。因此,Teradata咨询服务部提供专门为特定企业而设计的定制解决方案,这使企业能从传统及新型数据中获取最大的价值。通过Teradata统一数据架构,Teradata成为第一个将所有类型的数据统一到单一架构中的公司,这使企业能从企业内部的方方面面获得洞察。Teradata咨询服务已向全球市场提供超过25年的软件及咨询服务,拥有丰富的经验。

作者:  李伟

来源: IT168

原文标题:Teradata整合大数据分析架构

相关实践学习
基于Hologres轻量实时的高性能OLAP分析
本教程基于GitHub Archive公开数据集,通过DataWorks将GitHub中的项⽬、行为等20多种事件类型数据实时采集至Hologres进行分析,同时使用DataV内置模板,快速搭建实时可视化数据大屏,从开发者、项⽬、编程语⾔等多个维度了解GitHub实时数据变化情况。
阿里云实时数仓实战 - 用户行为数仓搭建
课程简介 1)学习搭建一个数据仓库的过程,理解数据在整个数仓架构的从采集、存储、计算、输出、展示的整个业务流程。 2)整个数仓体系完全搭建在阿里云架构上,理解并学会运用各个服务组件,了解各个组件之间如何配合联动。 3 )前置知识要求:熟练掌握 SQL 语法熟悉 Linux 命令,对 Hadoop 大数据体系有一定的了解   课程大纲 第一章 了解数据仓库概念 初步了解数据仓库是干什么的 第二章 按照企业开发的标准去搭建一个数据仓库 数据仓库的需求是什么 架构 怎么选型怎么购买服务器 第三章 数据生成模块 用户形成数据的一个准备 按照企业的标准,准备了十一张用户行为表 方便使用 第四章 采集模块的搭建 购买阿里云服务器 安装 JDK 安装 Flume 第五章 用户行为数据仓库 严格按照企业的标准开发 第六章 搭建业务数仓理论基础和对表的分类同步 第七章 业务数仓的搭建  业务行为数仓效果图  
相关文章
|
2月前
|
存储 分布式计算 大数据
基于Python大数据的的电商用户行为分析系统
本系统基于Django、Scrapy与Hadoop技术,构建电商用户行为分析平台。通过爬取与处理海量用户数据,实现行为追踪、偏好分析与个性化推荐,助力企业提升营销精准度与用户体验,推动电商智能化发展。
|
3月前
|
存储 SQL 分布式计算
终于!大数据分析不用再“又要快又要省钱”二选一了!Dataphin新功能太香了!
Dataphin推出查询加速新功能,支持用StarRocks等引擎直连MaxCompute或Hadoop查原始数据,无需同步、秒级响应。数据只存一份,省成本、提效率,权限统一管理,打破“又要快又要省”的不可能三角,助力企业实现分析自由。
222 49
|
2月前
|
机器学习/深度学习 大数据 关系型数据库
基于python大数据的台风灾害分析及预测系统
针对台风灾害预警滞后、精度不足等问题,本研究基于Python与大数据技术,构建多源数据融合的台风预测系统。利用机器学习提升路径与强度预测准确率,结合Django框架实现动态可视化与实时预警,为防灾决策提供科学支持,显著提高应急响应效率,具有重要社会经济价值。
|
2月前
|
机器学习/深度学习 大数据 关系型数据库
基于python大数据的青少年网络使用情况分析及预测系统
本研究基于Python大数据技术,构建青少年网络行为分析系统,旨在破解现有防沉迷模式下用户画像模糊、预警滞后等难题。通过整合多平台亿级数据,运用机器学习实现精准行为预测与实时干预,推动数字治理向“数据驱动”转型,为家庭、学校及政府提供科学决策支持,助力青少年健康上网。
|
2月前
|
传感器 人工智能 监控
拔俗多模态跨尺度大数据AI分析平台:让复杂数据“开口说话”的智能引擎
在数字化时代,多模态跨尺度大数据AI分析平台应运而生,打破数据孤岛,融合图像、文本、视频等多源信息,贯通微观与宏观尺度,实现智能诊断、预测与决策,广泛应用于医疗、制造、金融等领域,推动AI从“看懂”到“会思考”的跃迁。
|
3月前
|
存储 JSON 数据处理
ClkLog埋点与用户行为分析系统:架构升级与性能全面提升
随着越来越多企业在实际业务中使用 ClkLog,数据规模和分析需求也不断提升,部分用户日活已经超过10万,为了顺应这一趋势,ClkLog 秉持 “开放透明、持续演进”的理念,推出了迄今为止最重要的一次性能优化升级。新版本在大规模数据处理与复杂查询场景中,性能表现实现了跨越式提升。经过多轮研发与严格测试,新版本现已正式上线:在原有付费版 1.0 的基础上架构全面升级,并同步发布全新的 2.0 版本。为用户带来更强的性能与更广的适用场景。
|
3月前
|
机器学习/深度学习 传感器 分布式计算
数据才是真救命的:聊聊如何用大数据提升灾难预警的精准度
数据才是真救命的:聊聊如何用大数据提升灾难预警的精准度
199 14
|
5月前
|
数据采集 分布式计算 DataWorks
ODPS在某公共数据项目上的实践
本项目基于公共数据定义及ODPS与DataWorks技术,构建一体化智能化数据平台,涵盖数据目录、归集、治理、共享与开放六大目标。通过十大子系统实现全流程管理,强化数据安全与流通,提升业务效率与决策能力,助力数字化改革。
170 4
|
4月前
|
机器学习/深度学习 运维 监控
运维不怕事多,就怕没数据——用大数据喂饱你的运维策略
运维不怕事多,就怕没数据——用大数据喂饱你的运维策略
162 0

热门文章

最新文章