HBase+Spark技术双周刊 第八期

本文涉及的产品
Redis 开源版,标准版 2GB
推荐场景:
搭建游戏排行榜
云原生多模数据库 Lindorm,多引擎 多规格 0-4节点
云数据库 Tair(兼容Redis),内存型 2GB
简介: 【点击订阅HBase+Spark技术双周刊】 近期线上直播 【直播资料下载】HBase多语言访问 线下沙龙最全资料下载往期回顾 阿里云栖开发者沙龙 - BigData NoSQL Meetup(上海站)【精彩直播+最全资料下载】阿里云栖开发者沙龙 - BigData NoSQL Meetup(上海站)业内大咖齐聚,各大技术社区支持,与你畅聊 BigData NoSQL中国HBase技术社区第十届meetup——HBase生态实践(杭州站)
中国HBase技术社区第十届meetup——HBase生态实践(杭州站)回顾,4位数据库技术大咖共话HBase技术实践。

【点击订阅HBase+Spark技术双周刊】


__400877738

近期线上直播


【直播资料下载】HBase多语言访问

线下沙龙最全资料下载往期回顾


阿里云栖开发者沙龙 - BigData NoSQL Meetup(上海站)
【精彩直播+最全资料下载】阿里云栖开发者沙龙 - BigData NoSQL Meetup(上海站)业内大咖齐聚,各大技术社区支持,与你畅聊 BigData NoSQL

中国HBase技术社区第十届meetup——HBase生态实践(杭州站)

中国HBase技术社区第十届meetup——HBase生态实践(杭州站)回顾,4位数据库技术大咖共话HBase技术实践。

中国HBase技术社区第九届meetup——HBase典型应用场景与实践(北京站)

中国HBase技术社区第九届meetup——HBase典型应用场景与实践(北京站)回顾,阿里巴巴,360,58,京东等公司数据库技术大咖共话HBase技术实践。

中国HBase技术社区第八届MeetUp ——HBase应用实践专场 (南京站)

中国HBase技术社区第八届MeetUp ——HBase应用实践专场 (南京站)回顾,阿里云,毕马威,苏宁等公司数据库技术大咖共话HBase技术实践。

中国HBase技术社区第七届MeetUp ——HBase技术与应用实践(成都站)

中国HBase技术社区第七届MeetUp ——HBase技术与应用实践(成都站),阿里巴巴,爱奇艺,巨鹏等公司数据库技术大咖共话HBase技术实践。


优质博文


Phoenix(云 HBase SQL)核心功能原理及应用场景介绍
阿里云HBase SQL(Phoenix)服务深度解读
广告点击数实时统计:Spark StructuredStreaming + Redis Streams

问答专栏


欢迎大家提问,一起探讨HBase&Spark技术

数据从其他源迁移同步到HBase中怎么做,有人知道吗?
请教一下,Caused by: org.apache.hadoop.hbase.CallQueueTooBigException: Call queue is full on /0.0.0.0:60020, too many items queued ? 有什么优化措施吗
Hbase 支持查询解析 wal 吗?
hbase 的API中的Table该如何理解,为什么必须要close掉?不close()会怎么样?
datanode要扩容加磁盘,服务器要重启,这种情况怎么操作安全些?是否要让datanode先下线?


还有些待回答欢迎前来讨论:

java连接hbase开启kerberos失败
cdh安装如何在host中配置多个ip
建表时加盐怎么加性能比较好


技术社群


【HBase生态+Spark社区大群】
群福利:群内每周进行群直播技术分享及问答
加入方式1:点击link申请加入
加入方式2:钉钉扫码加入
1

【Cassandra 社区大群】
群福利:群内每周进行群直播技术分享及问答
加入方式1:点击link申请加入
加入方式2:钉钉扫码加入
cassandra

相关文章
|
6月前
|
存储 分布式计算 Hadoop
从“笨重大象”到“敏捷火花”:Hadoop与Spark的大数据技术进化之路
从“笨重大象”到“敏捷火花”:Hadoop与Spark的大数据技术进化之路
283 79
|
10月前
|
存储 分布式计算 Hadoop
数据湖技术:Hadoop与Spark在大数据处理中的协同作用
【10月更文挑战第27天】在大数据时代,数据湖技术凭借其灵活性和成本效益成为企业存储和分析大规模异构数据的首选。Hadoop和Spark作为数据湖技术的核心组件,通过HDFS存储数据和Spark进行高效计算,实现了数据处理的优化。本文探讨了Hadoop与Spark的最佳实践,包括数据存储、处理、安全和可视化等方面,展示了它们在实际应用中的协同效应。
440 2
|
10月前
|
存储 分布式计算 Hadoop
数据湖技术:Hadoop与Spark在大数据处理中的协同作用
【10月更文挑战第26天】本文详细探讨了Hadoop与Spark在大数据处理中的协同作用,通过具体案例展示了两者的最佳实践。Hadoop的HDFS和MapReduce负责数据存储和预处理,确保高可靠性和容错性;Spark则凭借其高性能和丰富的API,进行深度分析和机器学习,实现高效的批处理和实时处理。
390 1
|
分布式计算 大数据 Spark
Spark大数据处理:技术、应用与性能优化(全)PDF书籍推荐分享
《Spark大数据处理:技术、应用与性能优化》深入浅出介绍Spark核心,涵盖部署、实战与性能调优,适合初学者。作者基于微软和IBM经验,解析Spark工作机制,探讨BDAS生态,提供实践案例,助力快速掌握。书中亦讨论性能优化策略。[PDF下载链接](https://zhangfeidezhu.com/?p=347)。![Spark Web UI](https://img-blog.csdnimg.cn/direct/16aaadbb4e13410f8cb2727c3786cc9e.png#pic_center)
305 1
Spark大数据处理:技术、应用与性能优化(全)PDF书籍推荐分享
|
分布式计算 Java Apache
Apache Spark Streaming技术深度解析
【9月更文挑战第4天】Apache Spark Streaming是Apache Spark生态系统中用于处理实时数据流的一个重要组件。它将输入数据分成小批次(micro-batch),然后利用Spark的批处理引擎进行处理,从而结合了批处理和流处理的优点。这种处理方式使得Spark Streaming既能够保持高吞吐量,又能够处理实时数据流。
200 0
|
机器学习/深度学习 分布式计算 API
技术好文:Spark机器学习笔记一
技术好文:Spark机器学习笔记一
114 0
|
存储 SQL 分布式计算
技术心得记录:深入学习HBase架构原理
技术心得记录:深入学习HBase架构原理
|
存储 缓存 分布式计算
必知的技术知识:Hbase配置(伪分布式模式)
必知的技术知识:Hbase配置(伪分布式模式)
1156 0
|
分布式计算 安全 Shell
Maxcompute Spark 访问 阿里云 Hbase
引子 本来这个东西是没啥好写的,但是在帮客户解决问题的时候,发现链路太长,不能怪客户弄不出来,记录一下 需求列表 MaxCompute Spark包 (写文章时刻为版本 0.32.1, 请自行更新,本文不是文档) Spark 配置 spark.
Maxcompute Spark 访问 阿里云 Hbase
|
分布式计算 Spark
spark访问hbase
import org.apache.hadoop.hbase.{HBaseConfiguration, HTableDescriptor} import org.apache.hadoop.hbase.mapreduce.TableInputFormat import org.apache.spark.rdd.NewHadoopRDD val conf = HBaseConfigurat
1731 0