HBase+Spark技术双周刊第1期-阿里云开发者社区

HBase+Spark技术双周刊第1期

2018-11-22 2686

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： HBase技术双周刊第1期来袭！HBase多模式、HBase内核及能力以及Spark介绍及Spark多数据源分析等精彩直播，HBase 在人工智能场景的使用、HBase2.0重新定义小对象实时存取精彩技术分享！

精彩直播

HBase多模式

HBase多模式，包括分析层：支持复杂分析、算子下推；多模式层：提供各种模型转换，贴切业务；索引引擎：提供索引支持，基于 Lucene ；存储引擎：提供 KV 支持，基于LSM；分布式文件层：保障低成本、与上层分离、共享降低成本。本次直播，阿里云数据架构师明惠就为大家分享HBase多模式。

HBase内核及能力

HBase内核及能力包括：HBase的特性与生态：自动分区、LSM Tree、存储计算分离、HBase生态；全新的HBase2.0版本新功能：小对象存储MOB、读写链路Off-heap 、Region Replica 、In Memory Compaction 、Assignment MangerV2。在本次直播中，阿里巴巴技术专家正研就将为大家分享HBase内核及能力。

中国HBase技术社区第八届MeetUp（南京站） ——HBase应用实践专场【培训视频及资料下载】
2018年11月17号，由中国HBase技术社区、DataFun社区联合氪空间主办的中国第八届HBase Meetup将来到南京，届时来自阿里云、毕马威、苏宁等公司HBase的专家们，将为大家分享HBase的应用实践。

Spark介绍及Spark多数据源分析
开源大数据处理首选Spark，Spark引擎助力数据构架升级，大数据构架分为多种系统，如：流式处理系统、离线分析系统、算法分析系统、交互式分析系统，通过阿里多模型数据库专家沐远的讲解学习Spark并解决各种业务问题。

技术分享

HBase 在人工智能场景的使用

近几年来，人工智能逐渐火热起来，特别是和大数据一起结合使用。人工智能的主要场景又包括图像能力、语音能力、自然语言处理能力和用户画像能力等等。这些场景我们都需要处理海量的数据，处理完的数据一般都需要存储起来，这些数据的特点主要有如下几点：大、稀疏、列动态变化。

HBase2.0重新定义小对象实时存取

小对象，特别指1K~10MB范围的数据，比如图片，短视频，文档等广泛的存在于人工智能，医疗，教育，生活分享，电子商务等领域。HBase 2.0在MOB技术的加持下重新定义小对象实时存取，具有低延迟，读写强一致，检索能力强，水平易扩展等关键能力。本文将以一条SQL展开小对象实时存取的方案演进，介绍不同架构的优缺点。然后提供人工智能和医疗方面两个采用HBase2.0的案例分析。最后总结小对象实时存取的最佳实践。

消灭毛刺！HBase2.0全链路offheap效果拔群

阿里云HBase2.0版本是基于社区2018年发布的HBase2.0.0版本开发的全新版本。在社区HBase2.0.0版本基础上，做了大量的改进和优化，吸收了众多阿里内部成功经验，比社区HBase版本具有更好的稳定性和性能，同时具备了HBase2.0提供的全新能力。HBase2.0提供的新功能介绍可以参照这篇文章。如果想要申请使用全新的HBase2.0版本，可以在此链接申请试用。

技术社群

【HBase生态+Spark社区大群】

群福利：群内每周进行群直播技术分享及问答

加入方式1：

点击link申请加入 https://dwz.cn/Fvqv066s

加入方式2：

钉钉扫码加入：

HBase+Spark技术双周刊第1期

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

HBase+Spark技术双周刊第1期

热门文章

最新文章

相关课程

相关电子书