HBase+Spark技术双周刊 第三期

简介: 最全资料下载 直播往期回顾 直播排期 推荐专家 精彩问答

500687507

最全资料下载


2018年 | HBase生态社群画像 +最全资料汇总下载
在本文中,云栖社区与阿里云多模型数据库组联合出品了《HBase生态社群画像》,并且附上了最全汇总资料,如HBase开发者画像、HBase顶级盛会与技术沙龙、HBase优质博文以及HBase技术社群,干货满满,精彩不容错过!

直播往期回顾——视频回看及PPT下载


GeoMesa时空基础及应用场景
GeoMesa是一款开源的基于分布式计算系统的面向海量时空数据查询与分析的工具包。在本次直播中, 阿里云数据库技术专家肖斐首先介绍了GeoMesa基于HBase系统的整体架构与部署架构,其次,分析了其时空索引原理与算法实现,最后简要介绍了GeoMesa与Spark、Kafka、Lambda等开源系统或架构的整合方式。
错过了直播,不要错过回看哦!

【2019年1月HBase群直播分享排期】


1月8日 Graph图数据库基础介绍及场景 陈江
1月15日 Solr增强HBase检索能力基础介绍及场景 天斯
1月22日 Phoenix 全局索引原理与实践 张赟
1月29日 Spark on rds/MongoDB/HBase/Redis/OSS多数据源 云覆

推荐专家


所在——阿里高级产品专家
朱洁(所在),阿里云数据库NoSQL/HybridDB产品线产品负责人。具有10多年数据库/大数据研发管理经验,专注于数据库/大数据服务平台建设、规划和实践应用。目前已出版图书《大数据架构详解:从数据获取到深度学习》。想了解,所在 “一个产品经理的修炼之路”,点击链接查看吧!

精彩问答


阿里云HBase的小版本升级需要多久?
想了解Spark ShuffleMapTask计算的输出文件是如何把大于内存的输入数据(HDFS数据源)进行合并相同key,并进行排序的
HBase通过快照跨集群备份有什么优缺点呢?
Spark如何保证woker上 executor中运行的task不会太多
hbase整合es和hbase+phoenix,两个方案,哪个更好呢?

技术社群


【HBase生态+Spark社区大群】
群福利:群内每周进行群直播技术分享及问答
加入方式1:点击link申请加入
加入方式2:钉钉扫码加入
1

相关文章
|
9月前
|
存储 分布式计算 Hadoop
从“笨重大象”到“敏捷火花”:Hadoop与Spark的大数据技术进化之路
从“笨重大象”到“敏捷火花”:Hadoop与Spark的大数据技术进化之路
446 79
|
存储 分布式计算 Hadoop
数据湖技术:Hadoop与Spark在大数据处理中的协同作用
【10月更文挑战第27天】在大数据时代,数据湖技术凭借其灵活性和成本效益成为企业存储和分析大规模异构数据的首选。Hadoop和Spark作为数据湖技术的核心组件,通过HDFS存储数据和Spark进行高效计算,实现了数据处理的优化。本文探讨了Hadoop与Spark的最佳实践,包括数据存储、处理、安全和可视化等方面,展示了它们在实际应用中的协同效应。
568 2
|
存储 分布式计算 Hadoop
数据湖技术:Hadoop与Spark在大数据处理中的协同作用
【10月更文挑战第26天】本文详细探讨了Hadoop与Spark在大数据处理中的协同作用,通过具体案例展示了两者的最佳实践。Hadoop的HDFS和MapReduce负责数据存储和预处理,确保高可靠性和容错性;Spark则凭借其高性能和丰富的API,进行深度分析和机器学习,实现高效的批处理和实时处理。
461 1
|
分布式计算 大数据 Spark
Spark大数据处理:技术、应用与性能优化(全)PDF书籍推荐分享
《Spark大数据处理:技术、应用与性能优化》深入浅出介绍Spark核心,涵盖部署、实战与性能调优,适合初学者。作者基于微软和IBM经验,解析Spark工作机制,探讨BDAS生态,提供实践案例,助力快速掌握。书中亦讨论性能优化策略。[PDF下载链接](https://zhangfeidezhu.com/?p=347)。![Spark Web UI](https://img-blog.csdnimg.cn/direct/16aaadbb4e13410f8cb2727c3786cc9e.png#pic_center)
406 1
Spark大数据处理:技术、应用与性能优化(全)PDF书籍推荐分享
|
分布式计算 Java Apache
Apache Spark Streaming技术深度解析
【9月更文挑战第4天】Apache Spark Streaming是Apache Spark生态系统中用于处理实时数据流的一个重要组件。它将输入数据分成小批次(micro-batch),然后利用Spark的批处理引擎进行处理,从而结合了批处理和流处理的优点。这种处理方式使得Spark Streaming既能够保持高吞吐量,又能够处理实时数据流。
304 0
|
机器学习/深度学习 分布式计算 API
技术好文:Spark机器学习笔记一
技术好文:Spark机器学习笔记一
159 0
|
存储 SQL 分布式计算
技术心得记录:深入学习HBase架构原理
技术心得记录:深入学习HBase架构原理
|
存储 缓存 分布式计算
必知的技术知识:Hbase配置(伪分布式模式)
必知的技术知识:Hbase配置(伪分布式模式)
1345 0
|
分布式计算 安全 Shell
Maxcompute Spark 访问 阿里云 Hbase
引子 本来这个东西是没啥好写的,但是在帮客户解决问题的时候,发现链路太长,不能怪客户弄不出来,记录一下 需求列表 MaxCompute Spark包 (写文章时刻为版本 0.32.1, 请自行更新,本文不是文档) Spark 配置 spark.
Maxcompute Spark 访问 阿里云 Hbase
|
分布式计算 Spark
spark访问hbase
import org.apache.hadoop.hbase.{HBaseConfiguration, HTableDescriptor} import org.apache.hadoop.hbase.mapreduce.TableInputFormat import org.apache.spark.rdd.NewHadoopRDD val conf = HBaseConfigurat
1750 0