大数据市场迎来扩容期 本土内存数据库抢位崛起

本文涉及的产品
阿里云百炼推荐规格 ADB PostgreSQL,4核16GB 100GB 1个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介:

日前,中国人民大学大数据统计实验室最新发布的研究认为,2016年国内大数据预计将突破1000亿元市场规模,未来四年将呈爆发性增长,2020大数据市场规模有望突破8000亿元,本土内存数据库将进入新蓝海时代。

国际标准组织大数据专家、柏睿数据科技公司董事长兼CTO刘睿民认为,中国的数据库行业将迎来颠覆性变革,由中国自主研发的核心技术软件也将迎来更多的话语权。2016年我国的内存数据库有望改写由甲骨文雄霸数据库市场的历史,中国的内存数据库市场正迎来新的拐点。

内存数据新蓝海扑面而来

“作为国内内存数据库厂商,我们公司已经收获了若干1000万元级别的大单,主要客户包括国家电网、中国移动、中国联通等。目前,国内的内存数据库行业已经走过了试水期,正在全面打开国内外市场。与去年相比,国内市场需求呈现递增趋势。”刘睿民表示,柏睿在海外市场也将有所突破,将和房利美(美国两房之一)在大数据实时分析领域有深度合作。

有关专家指出,作为一家创业公司,柏睿能够收获1000万元级别的大单,这并不是偶然,这里面有着深刻的时代背景。在大数据时代,人人都想多分一杯羹,未来世界必然是数据时代,谁拥有海量能被处理、分析、使用的数据,才能成为拥有未来数据金矿的人。从大数据中“挖出金矿”,是真正考验核心硬技术的阶段,而这一技术现阶段对全球都是公平的。

中国数据库崛起的主要标志是中国的核心技术获国际话语权。在美国孟菲斯ISO/IECJTC1/SC32“数据管理与交换”分技术委员会2016年全会上,刘睿民代表中国代表团将他拥有的流数据库标准提交的大数据技术提案“SQL对MapReduce及与之相关的流数据处理的支持”,当时该数据库各项指标准完胜美国、德国,获得SC32全会决议通过,即将成为2018国际数据库新国际标准。这是29年来中国首度在国际标准委员会独立提出技术提案并获通过。这充分说明中国技术业已全面突破国际大数据核心技术壁垒实现真正意义上的国产化。

近期,国外爆发了若干网络攻击事件,就是数据库无法处理互联时代海量多渠道并发数据导致的悲剧。刘睿民认为,互联时代数以亿计的智能硬件连接到互联网,其数据量大到惊人,倘若不解决核心技术问题,未来这样的事件,无论在国内还是国外都会频发,所以流数据库就是解决这一问题的关键所在。刘睿民并不担心市场,从订单可以看到,越来越多的企业正深刻认识到海量数据来临时,实时处理数据比仅存储更有意义。

刘睿民创办柏睿前,曾任多家世界级跨国IT公司的大中国区及亚太高管,归国前在硅谷Tandem公司师从图灵奖大神级得主JimGray,共同参与过TandemNonStopSQL/MP的内核编写。Tandem公司的MPP分布式数据库迄今为止依然在欧美的高端市场傲视群雄。因为有一个共同打造新时代世界级数据库的目标,刘睿民把最早期Tandem并行数据库的实现团队成员,也有长期供职于美国HP实验室的顶级系统架构师这些数据库行业的顶级专家整合到了一起。

早在去年,柏睿数据就已经完成了数千万级的Pre-A融资,领投机构为蓝驰创投,这也是国内顶级基金蓝驰创投在大数据核心技术方向上插下的一个重要旗帜,而之后信中利及浦发硅谷银行的加盟也让公司更加从容应对市场。

中国谁能挑战甲骨文独霸江湖地位

一直以来,甲骨文无疑是计算机单机共享内存时代“皇冠上的明珠”,是核心基础软件中唯一横跨CPU、操作系统的关键性技术。所以甲骨文的成就一直被追随但从未被超越,而现在柏睿数据所创造的分布式流数据库技术植根于互联网时代的产物,它恰恰为解决数据流多并发导致的系统瘫痪问题而生,具备真正互联网的基因,解决了海量数据多渠道来临时数据处理能力的核心问题。

众所周知,传统企业级内存数据库尤其是MPP内存数据仓库由于技术壁垒非常高,市场一直由Oracle、SAPHANA、Teradata这三家国际数据库巨头牢牢把控。国内数据仓库领域,迄今为止还没有一家国产厂商在纯关系型MPP内存数据仓库方向上形成技术突围,此次柏睿数据在技术上的成功突围可谓是中国数据仓库领域的“诺曼底反攻”。

刘睿民早年留学海外,曾加盟惠普实验室主攻海量并行MPP数据库,曾先后参与NonstopSQL/MP、SQL/MX及Neoview的实现。2014年,刘睿民组建团队正式进军大数据MPP内存数据仓库引擎研究,公司拥有世界顶尖级的大数据平台研发团队,并在硅谷、澳洲以及印度设立了研发中心,创新性的推出了面向实时大数据分析领域的高性能分析应用平台RapidsDataPlatform(简称RDP),从功能上可划分为:RapidsHadoop、RapidsDB、RapidsStream,RapidsManager等产品,为行业客户提供了从大数据存储到分析挖掘的完整解决方案。

刘睿民表示,几年前,做技术的人都知道没有一个系统的使用可以绕得开数据库,数据量越多对数据库的依赖越强,而当时国内外的数据库市场被甲骨文数据库垄断,所以说没有系统可以绕开甲骨文的,但是现在,我可以自豪的说甲骨文已经属于过去式。2016年,我们的内存数据库将改写由甲骨文雄霸数据库市场的历史。面对海量数据多渠道并发时代,柏睿的RapidsDB内存数据库突破了传统基于磁盘的数据仓库技术,解决了传统数据仓库难以分析结构化以外数据的难题,并充分利用内存的高性能,通过线性扩展及整合方案为企业带来大幅度显著效益提升。流数据库现在还是非常新的一个东西,所以并没有大范围普及,但一些对技术前瞻性要求的行业如电讯、金融、政府客户已经在开始使用。

本文转自d1net(转载)

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
3月前
|
文字识别 算法 API
视觉智能开放平台产品使用合集之人脸数据库容量是否支持扩容
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
|
3月前
|
存储 移动开发 数据库
视觉智能开放平台产品使用合集之人脸数据库容量是否支持扩容
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
|
4月前
|
人工智能 算法 搜索推荐
数据平台演进问题之在AI时代传统数据库会面临什么变化
数据平台演进问题之在AI时代传统数据库会面临什么变化
|
7天前
|
算法 大数据 数据库
云计算与大数据平台的数据库迁移与同步
本文详细介绍了云计算与大数据平台的数据库迁移与同步的核心概念、算法原理、具体操作步骤、数学模型公式、代码实例及未来发展趋势与挑战。涵盖全量与增量迁移、一致性与异步复制等内容,旨在帮助读者全面了解并应对相关技术挑战。
16 3
|
4月前
|
人工智能 搜索推荐 算法
数据平台演进问题之数据库技术面临挑战如何解决
数据平台演进问题之数据库技术面临挑战如何解决
|
23天前
|
SQL 缓存 大数据
C#高效处理大数据的批次处理,以及最好的数据库设计
C#高效处理大数据的批次处理,以及最好的数据库设计
42 0
|
23天前
|
大数据 关系型数据库 数据库
python 批量处理大数据写入数据库
python 批量处理大数据写入数据库
62 0
|
3月前
|
关系型数据库 MySQL 大数据
教你使用Python玩转MySQL数据库,大数据导入不再是难题!
教你使用Python玩转MySQL数据库,大数据导入不再是难题!
|
3月前
|
分布式计算 DataWorks 关系型数据库
DataWorks产品使用合集之ODPS数据怎么Merge到MySQL数据库
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
|
4月前
|
存储 关系型数据库 MySQL
mysql 查看数据库及表大小以及数据库扩容评估
mysql 查看数据库及表大小以及数据库扩容评估
116 4