hive数据源,yarn集群测试,SQL分组取topN-2 | 学习笔记

简介: 快速学习hive数据源,yarn集群测试,SQL分组取topN-2

开发者学堂课程【大数据实时计算框架Spark快速入门  hive数据源,yarn集群测试,SQL分组取topN-2】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/100/detail/1715


hive 数据源,yarn  集群测试, SQL 分组取topN-2


内容介绍:

一、具体内容

二、操作过程



一、具体内容

hive  的窗口不用一直开着,只要验证一下可以连上就行,我们执行  master  模式,找到地址,如果能够看到下面的两行,则是可以看见  collect  了, for  循环出来了,但在之前是  saveastable hivecontext.

已经存了的,所以在后面  hiveconect  才可以读到,最后在  hive  里面要取这个表,上一次在  hive  里面什么表也没有,那这一次刨完之后再设置  table。

二、操作过程

首先有两张表,一个  student infos  另一个则是  student scores  ,这两个是我们加载本文件导进去的,接着经过运算后, join  就会生成新的表,以后读数据并不是需要每次导一个数据进去,有可能  hive  表已经存在了,不需要每次都一样,下面换成  class  模式来执行会有一个显而易见的问题,炸包会找不到,那么同样在这个地方上传上去,地址并没有改,下面的  running drivers  则可以直接跟到  drivers  来,那么  running  还在执行,会源源不断输出东西来,running drivers   那个驱动程序,cores则是占了一个核那么就是默认一个driver就会是一个核,默认一个  sql  里面一个G的内存,那么默认一个  application  两个  cores  每个  menory per node一个G。

相关文章
|
8月前
|
算法 数据挖掘 数据库
通过 SQL 快速使用 OceanBase 向量检索学习笔记
通过 SQL 快速使用 OceanBase 向量检索学习笔记
|
8月前
|
SQL 数据库
SQL 学习笔记 - 多表关系与多表查询
数据库多表关系包括一对多、多对多和一对一,常用外键关联。多表查询方式有隐式/显式内连接、外连接、子查询等,支持别名和条件筛选。子查询分为标量、列、行、表子查询,常用于复杂查询场景。
|
SQL 分布式计算 资源调度
Dataphin功能Tips系列(48)-如何根据Hive SQL/Spark SQL的任务优先级指定YARN资源队列
如何根据Hive SQL/Spark SQL的任务优先级指定YARN资源队列
493 4
|
SQL 存储 分布式计算
Hadoop-16-Hive HiveServer2 HS2 允许客户端远程执行HiveHQL HCatalog 集群规划 实机配置运行
Hadoop-16-Hive HiveServer2 HS2 允许客户端远程执行HiveHQL HCatalog 集群规划 实机配置运行
342 3
|
SQL 分布式计算 Hadoop
Hadoop-12-Hive 基本介绍 下载安装配置 MariaDB安装 3台云服务Hadoop集群 架构图 对比SQL HQL
Hadoop-12-Hive 基本介绍 下载安装配置 MariaDB安装 3台云服务Hadoop集群 架构图 对比SQL HQL
404 3
|
SQL 分布式计算 Hadoop
Hadoop-19 Flume Agent批量采集数据到HDFS集群 监听Hive的日志 操作则把记录写入到HDFS 方便后续分析
Hadoop-19 Flume Agent批量采集数据到HDFS集群 监听Hive的日志 操作则把记录写入到HDFS 方便后续分析
351 2
|
SQL 存储 数据管理
Hadoop-15-Hive 元数据管理与存储 Metadata 内嵌模式 本地模式 远程模式 集群规划配置 启动服务 3节点云服务器实测
Hadoop-15-Hive 元数据管理与存储 Metadata 内嵌模式 本地模式 远程模式 集群规划配置 启动服务 3节点云服务器实测
310 2
|
SQL 分布式计算 Java
大数据-96 Spark 集群 SparkSQL Scala编写SQL操作SparkSQL的数据源:JSON、CSV、JDBC、Hive
大数据-96 Spark 集群 SparkSQL Scala编写SQL操作SparkSQL的数据源:JSON、CSV、JDBC、Hive
416 0
|
SQL 分布式计算 关系型数据库
Hadoop-24 Sqoop迁移 MySQL到Hive 与 Hive到MySQL SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
Hadoop-24 Sqoop迁移 MySQL到Hive 与 Hive到MySQL SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
442 0