本文PPT来自阿里中间件高级专家沈春辉于10月16日在2016年杭州云栖大会上发表的《大数据时代的储存——HBase的实践与探索》。
我们现在都过着一个数据驱动的生活,不管是安全风控、生意参谋、还是借贷保险、或是出行决策,背后都少不了大数据的支撑。大数据场景本身固有的数据基础量大、增长快、时效性短、易发散和易产生脏数据等问题,导致人们投入了大量的精力来开发处理解决这些问题的数据库系统,比如Teradata、MongoDB、Cassandra、HBase、PostgreSQl等。
在这些系统就有我们今天的主角——HBase。HBase,全称Hadoop Database,是一个基于Google BigTable论文设计的高可靠性、高性能、可伸缩的分布式储存系统。HBase支持实时更新、增量导入、多维删除、随机查询、范围查询等功能,具有自动分区、LSM Tree、储存计算分离和Hadoop生态这四大基因。由于期性能优越,HBase已经被微软、雅虎、阿里巴巴、Facebook等大公司使用。目前,HBase投入使用的应用实例包括基于大数据的安全风控、实时计算的数字大屏、海量数据的基础储存等。
阿里对HBase很重视,并且对HBase的储存建设也投入了很多。基于阿里巴巴/蚂蚁的环境和业务需求,阿里对社区HBase进行深度定制与改进,从内核引擎、解决方案、稳定护航、发展支撑全方位提供一站式大数据基础存储服务,其中包括如灾备体系、实时监控、数据排行等特色功能。未来,阿里将持续建设HBase,实现HBase的容器化部署,以提升资源使用率、实现跨应用混部和加强资源伸缩灵活性,并且随着云的不断建设,HBase上云的日子也指日可待了。