国内首个大数据平台性能标准制定完成

简介:

今天越来越多的企业认识到,大数据的掌控和分析能力将成为竞争力的核心,企业对大数据的投资也在不断扩大。Gartner调查显示,73%的企业计划在未来两年内投资大数据。以开源Hadoop、Spark等为基础的大数据基础平台解决方案和云服务如雨后春笋不断涌现,形成了近200亿美元的市场规模。然而对于很多企业用户来说,如何评价一个大数据平台的综合能力,常常是选型、平台建设和系统优化时面临的一大挑战。目前来看,国内外还缺乏一套能体现大数据特点,又简便易行,且被工业界广泛认可的大数据平台性能测试标准与工具。


记者日前从数据中心联盟(www.dca.org.cn)获悉,国内第一个大数据产品和服务基准测试规范《大数据平台基准测试技术要求》已经制定完成,将于2015年1月底公开发布。与该规范配套的评测工具源代码也将同期发布,并移交开源社区持续开发。


该基准测试规范的主要评价对象主要包括以下三类:

  • 大数据软件平台(如基于开源Hadoop、Spark平台的商业软件)、

  • 大数据软硬一体机

  • 云端大数据服务




规范根据大数据特点,精选了NoSQL、离线分析和实时交互分析等最具代表性的21个基本负载,能够考核平台在计算密集、I/O密集和混合任务等不同场景的表现。标准规定了数据生成、负载选择、测试指标、用例执行和测试配置。标准还从用户角度出发定义了多个维度的指标,不仅有基本的吞吐量质保,还有能耗、压力、扩展性、容错能力等多方面的指标,这些指标都是用户在选型和采购最关注的。

0


数据中心联盟常务副理事长何宝宏把基准测试形象的比喻为“公平秤”,他说:“我们设计测试基准的过程是开放的,大家平等参与,可信云和绿色数据中心相关标准制定都采用了这种方式,这些标准已经得到广泛认可。接下来需要按标准开发工具,我们会以开放源代码的方式把‘大数据公平秤’制造出来,并且免费交给厂商和用户使用,组织大家一起完善,这样买卖双方心里都有数,提高彼此的信任度。”“下一步,我们也将为可信云和绿色数据中心等标准,开发一系列开源的公平秤,欢迎业界一起参与贡献自己的力量。”


据了解,该规范是由该规范由中国信息通信研究院(原工业和信息化部电信研究院)牵头,联合中科院计算所、华为、中国移动、Intel、微软、IBM、新浪、百度、阿里、腾讯、浪潮、世纪互联、UCould等国内外知名公司和科研机构共同制定,囊括了国内外主流大数据产品与服务提供商。


数据中心联盟大数据工作组组长魏凯透露说:“联盟作为第三方行业组织,计划于2015年第一季度启动第一轮评测活动,并公开发布测试结果。此次测试活动是不仅国内大数据厂商水平的首次展示,通过这样的测试也可以减少厂商一些重复的、不必要的POC测试。”


据悉,下一步数据中心联盟将逐步吸纳行业典型应用场景,丰富测试用例和测试数据模型,形成覆盖Hadoop/Spark、MPP、NoSQL等多种产品与服务、面向电信、金融、政务等多个行业的“端到端”测试基准。长远目标是以基准测试工作为纽带,在大数据行业用户与平台供应商之间构建交流合作桥梁,加速大数据技术与行业深度融合。


【新闻连接:数据中心联盟是由工信部通 信发展司指导,中国信息通信研究院(原工信部电信研究院)联合国内外互联网企业、电信运营商、软硬件制造商等单位共同发起组建的,成立于2014年1月16日,目前共有会员单位93家。联盟设有可信云、政府采购、IT基础设施、绿色节能、大数据等8个工作组和研究组,以及负责天蝎服务器和数据中心微模块等工作的开放数据中心委员会



原文发布时间为:2014-12-28

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
11月前
|
SQL 机器学习/深度学习 分布式计算
「大数据架构」Spark 3.0发布,重大变化,性能提升18倍
「大数据架构」Spark 3.0发布,重大变化,性能提升18倍
|
8月前
|
存储 算法 大数据
倚天性能优化--基于倚天优化后的zstd在大数据场景应用:降低存储成本+提升重IO场景性能
倚天性能优化--基于倚天优化后的zstd在大数据场景应用:降低存储成本+提升重IO场景性能
|
SQL 前端开发 Java
大数据量下 MyBatis PageHelper 分页查询性能问题的解决办法
项目一直使用的是PageHelper实现分页功能,项目前期数据量较少一直没有什么问题。随着业务扩增,数据库扩增PageHelper出现了明显的性能问题。
|
存储 人工智能 运维
阿里云开源大数据平台升级EMR2.0发布 性能最高可提升6倍
阿里云EMR2.0为用户提供了全新的平台、开发、资源形态、分析场景等更优的产品体验,通过EMR Doctor健康检查、全面的服务巡检和事件通知、节点故障补偿等运维能力的升级,预估运维成本可降低20%-30%。新平台致力于为客户快速构建高性价比、安全可靠、兼容生态的开源大数据平台。
阿里云开源大数据平台升级EMR2.0发布  性能最高可提升6倍
|
大数据 数据挖掘 索引
Pandas处理大数据的性能优化技巧
Pandas是Python中最著名的数据分析工具。本文将介绍一些使用Pandas处理大数据时的技巧,希望对你有所帮助
74 0
Pandas处理大数据的性能优化技巧
|
存储 运维 分布式计算
阿里云开源大数据平台EMR全面升级 性能最高可提升6倍
12月27日,阿里云正式发布云原生开源大数据平台EMR 2.0,升级后的开源大数据平台在成本持平的情况下,扩缩容性能最高可提升6倍。
642 0
阿里云开源大数据平台EMR全面升级 性能最高可提升6倍
|
分布式计算 关系型数据库 MySQL
|
存储 弹性计算 人工智能
大数据性能提升28%!阿里云新一代本地SSD实例i4开放公测
计算性能稳定优异,极低访问延迟,主动运维
大数据性能提升28%!阿里云新一代本地SSD实例i4开放公测
|
大数据 C# 数据库
WPF DataGrid 性能加载大数据
原文:WPF DataGrid 性能加载大数据 版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/u010265681/article/details/76651725  WPF(Windows Presentation Foundation)应用程序在没有图形加速设备的机器上运行速度很慢是个公开的秘密,给用户的感觉是它太吃资源了,WPF程序的性能和硬件确实有很大的关系,越高档的机器性能越有优势。
2098 0
|
存储 搜索推荐 Java
Java8 Stream 数据流,大数据量下的性能效率怎么样?
Stream 是Java SE 8类库中新增的关键抽象,它被定义于 java.util.stream (这个包里有若干流类型:Stream<T> 代表对象引用流,此外还有一系列特化流,如 IntStream,LongStream,DoubleStream等。
Java8 Stream 数据流,大数据量下的性能效率怎么样?

热门文章

最新文章