5分钟迅速搭建云上Lambda大数据分析架构
背景Spark 中国社区联合阿里云 EMR 技术交流群,Tablestore 技术交流群举办了一场联合技术直播。直播的话题是“海量结构化数据的实时计算和处理”,主要介绍基于 Tablestore 的数据变更实时捕获订阅能力,实现云上Lambda 架构的轻量化实现。
CentOS7.x 安装Sqoop
sqoop是apache旗下一款“Hadoop和关系数据库服务器之间传送数据”的工具。
1. 下载并解压
2. 修改配置文件
2.1 进入/sqoop/conf目录
mv sqoop-env-template.
完全分布式Hadoop集群安装Phoenix
应用场景
当我们按照之前的博文,安装完Hadoop分布式集群之后,再安装了Hbase,当准备通过hbase shell命令开始使用Hbase的时候,发现hbase非常的难用,都是一些scan,status,describe命令等,无法像mysql,oracle,hive等通过一些简单的SQL语句来操作数据,但是通过Phoenix,它可以让Hbase可以通过SQL语句来进行操作。
阿里云物联网平台数据转发到消息服务(MNS)示例
您可以使用规则引擎将数据转到DataHub上,再由DataHub将数据流转至实时计算、MaxCompute等服务中,以实现更多计算场景。本文主要演示通过规则引擎将消息流转到MNS Topic,然后通过Queue订阅Topic中的消息。
CentOS 安装 hadoop hbase 使用 cloudera 版本。(一)
使用Virtualbox安装系统和 hadoop ,hbase
参考安装:
cloudera 的hadoop 只支持 64bit的版本.而要用虚拟机安装 64bit 的要满足 4个条件.
1, 64bit的cpu
3, 64bit的操作系统
3, 64bit的VirtualBox
4, 必须允许硬件虚拟化(需要到 bios 里面打开virtua
Spark教程
Spark官方网站
http://spark.apache.org
Spark通用性解释
Spark的特点
官方网站都有。