ZDNet至顶网软件频道消息:Teradata正在扩充其数据仓库和分析产品的用途,做法是在逻辑上将多个数据库合并在一起,以此将数据海洋和数据仓库结合在一起。
这是Teradata统一数据架构总图
Teradata是业界领先的数据仓库供应商,该公司正在将旗下的产品和更新的大数据/Hadoop设备整合在一起,让该公司的数据/商业智能的用户能够在数据的海洋中畅游,并用这种方式实现公司业务的增长。
公司的成长幅度已经不那么明显了,但得益于大数据的大热,公司仍在增长:
2015年第一季度情况还需等待
QueryGrid
Teradata的自助服务QueryGrid可以跨越多个分析引擎和数据库进行查询。它增加了QueryGrid连接器:
- Teradata-to-MapR
- 针对Hadoop 的Teradata-to-Cloudera Distribution
- 针对Hadoop 的Aster-to-Cloudera Distribution
- Teradata-to-Teradata的可用性
- 增强现有的Teradata-to-Hortonworks数据平台
这意味着用户可以使用单一查询语言进行更多的查询,而不必为了使用新的分析引擎访问新的库学习新的技能。他们也不必让数据从一个无法使用的仓库转移到可以使用的仓库。这些都让查询的速度变得更快。
Teradata表示将不同平台的——无论是私有的还是开放源代码的——数据和分析结合起来的好处跨越所有的垂直市场和数据源。这意味着不用联合仓库,而是用一个统一的界面使用它们。
软件定义数据仓库
该公司即将推出软件定义数据仓库,这也就是说客户可以“将多个数据仓库整合到一个系统之中,而且不用牺牲安全性或者服务级别性能。”
这对于他的数据库是一种增强。第二项改进是提供安全域,“它将数据和用户组按照不同的实体分开,并在不同的区域之间设置安全的边界”。这帮助客户达到隐私法规的要求,这些法规限制了数据在地理意义上的移动。
Teradata表示这些功能包括:
- 多租户部署分别管理来自多个业务单位或者组织的数据和用户。
- B2B分析服务简化托管并且为Teradata客户的伙伴管理B2B分析服务
- 数据市场整合,提供了“一种更简单的方法,让用户能够获得数据的企业视图,同时能够让每个数据集保持数据、用户、应用和工作负载”,不需要进行数据抽取、转换和加载(ETL)。
- 产生分析沙箱或者没有数据重复或者不用创建新的仓库的自助服务数据实验室。
针对Hadoop 的Dashboard引擎
ThinkBig,Teradata的大数据咨询业务引入了DEH(Dashboard Engine for Hadoop)。它表示:“Dashboard和在线分析流程(OLAP)会提供在商业智能市场周围徘徊了几十年的摘要。但是……没有一个人从大规模的多结构Big Data中获得OLAP摘要分析,”至少到现在为止。
它处理多种形式的多结构化数据,例如点击流、手机日志、传感器和JSON(JavaScript Object Notation)。
Teradata表示DEH能够以每小时数TB数据的速度提取数据,形成数十亿种聚合,商业用户可以使用它们。ThinkBig的总裁Ron Bodkin表示:“它为组织提供了能够在一秒钟之内总结Hadoop数据的能力,不用经历转换和建模。”
ThinkBig提供了安装和专家实施服务以帮助客户使用DEH。
Data Warehouse Appliance 2800
Teradata表示这款产品——全名:Teradata Data Warehouse Appliance 2800——是一个综合的数据仓库,和之前的版本相比,这款产品拥有两倍以上的计算能力,在同一机架上的数据容量最多高出四倍。
2800对内存处理的分析进行了优化,并且准备好运行装满组件的机架。它可以被用作数据仓库、数据集市、灾难恢复系统或者测试和开发使用的分析沙盒。
它配备了双Intel Xeon Haswell 14核CPU,高达512GB的DDR4内存和SuSE Linux。Teradata表示该系统使用了英特尔的向量指令集和板载缓存以提高性能。互联是Teradata的BYNET V5on InfiniBand。
它可以对Teradata智能记忆进行“自动、实时、基于使用的数据使用监控”,将“使用最频繁的数据放到内存中。”随着系统的扩展,总体可用内存会自动扩展,最多可以有12个节点的机柜,总共可以连接200个节点。
据说数据库管理员不用担心数据防止或者数据重组,因为内存和存储的设计是作为一个单位协同工作。
存储基于Dot Hill的Ultra48 AssuredSAN阵列,可以使用2.5英寸的300GB, 600GB, 900GB 和1.2TB硬盘。该系统可以扩展到54PB以上。盘状设计让磁盘分部在前面和后面,这样做有利于提高容量。
机柜包含了采用了无共享集群设计的Teradata Database、托管服务器和可选的备份技术。客户可以安装可选的第二生产系统,测试并开发能力,或者在同一个机柜中备份并回复存储硬件。
在这里可以查阅DWA 2800的数据表。
Teradata实验室的领导即将离职加盟Hortonworks
Scott Gnau自从2011年5月以来就一直担任Teradata实验室的总裁,目前即将离职去担任Hortonworks的首席技术官,Hortonworks是IPO的Hadoop分销商。我们理解他为Teradata的集成数据仓库、Big Data分析和相关的产品提供研发和销售支持活动方面的指导。他也也推动了Teradata从Teradata实验室投资并收购和解决方案相关的技术。
在一段录音中,Gnau表示:“Hortonworks推动了整个Hadoop生态系统,并且推动了企业通过它的产品的集中架构采用这个平台。”。他热衷于数据等。
Teradata会寻找另一个BI/BD(商业智能/大数据)高手来替代他。
可用性
QueryGrid的Hortonworks的功能将于五月份推出。针对Hadoop的Dashboard Engine的测试版目前就可用。GA将在第三季度推出。Teradata Data Warehouse 2800 Appliance全球有售,并且兼容Teradata Database 14.10及以后的版本。