hive 数据源、yarn 集群测试、SQL 分组取 topN3| 学习笔记

简介: 快速学习 hive 数据源、 yarn 集群测试、SQL 分组取 topN3

开发者学堂课程【大数据实时计算框架  Spark  快速入门hive  数据源、yarn  集群测试、SQL  分组取  topN3  】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/100/detail/1716


hive  数据源、yarn  集群测试、SQL  分组取  topN3


内容介绍:

一、两个方法


一、两个方法

“no files matching” 这个没有找到txt这个文件,是因为我们只把  txt  文件弄到node21  上面去了。

两个方法:

1、把那两个文件都弄到里面去,

2、可以改一个代码既然  hive  里面已经有一个  table  了,那就不用再弄了

可以用第一招,如果用  class  模式的话,则要继续跟踪页面,需要不断刷新页面,跟着日志。如果用  spark Standalone  来执行的话,他里面可以有哪些选项,则是——supervise ,——kill submissicm ——statue surmission id  来查看进度,

——supervise  加就是  driver  挂了就会重示,driver  挂了,加参数就会自动起一个  driver  那么在这个地方  soark standlone and mesos only里面有一个executor_core  看有多少个现成。

下面则是关于  yarn only  的,再往下就是  driver  的内存大小,已经executor_memory 的大小,executor  则是一个G的内存, worker 配置一个 G ,最多是三个 executor. 第一个 executer  是  driver  用了, executor_cores  的数量也会决定你可以启动的  worker ,内存会管理他的上限,显存也会管理他的上限,这个看机器里面有多少个先吃完,  如果以后用yarn来跑的话, yarn 则有一个——executors  直接配上用来跑应用程序,那关于这  yarn  ,则有多少  executor 来执行,接下来则等待报错。

在公司里面要么是  executor  要么是  yarn ,保证在每个里面提交  application ,不能同时起两个。

相关文章
|
8月前
|
算法 数据挖掘 数据库
通过 SQL 快速使用 OceanBase 向量检索学习笔记
通过 SQL 快速使用 OceanBase 向量检索学习笔记
|
8月前
|
SQL 数据库
SQL 学习笔记 - 多表关系与多表查询
数据库多表关系包括一对多、多对多和一对一,常用外键关联。多表查询方式有隐式/显式内连接、外连接、子查询等,支持别名和条件筛选。子查询分为标量、列、行、表子查询,常用于复杂查询场景。
|
存储 分布式计算 资源调度
大数据-04-Hadoop集群 集群群起 NameNode/DataNode启动 3台公网云 ResourceManager Yarn HDFS 集群启动 UI可视化查看 YarnUI(一)
大数据-04-Hadoop集群 集群群起 NameNode/DataNode启动 3台公网云 ResourceManager Yarn HDFS 集群启动 UI可视化查看 YarnUI(一)
374 5
|
资源调度 数据可视化 大数据
大数据-04-Hadoop集群 集群群起 NameNode/DataNode启动 3台公网云 ResourceManager Yarn HDFS 集群启动 UI可视化查看 YarnUI(二)
大数据-04-Hadoop集群 集群群起 NameNode/DataNode启动 3台公网云 ResourceManager Yarn HDFS 集群启动 UI可视化查看 YarnUI(二)
254 4
|
XML 分布式计算 资源调度
大数据-02-Hadoop集群 XML配置 超详细 core-site.xml hdfs-site.xml 3节点云服务器 2C4G HDFS Yarn MapRedece(一)
大数据-02-Hadoop集群 XML配置 超详细 core-site.xml hdfs-site.xml 3节点云服务器 2C4G HDFS Yarn MapRedece(一)
637 5
|
SQL 分布式计算 Hadoop
Hive SQL 优化
Hive SQL 优化
240 1
|
SQL 分布式计算 负载均衡
Hive SQL优化思路
Hive的优化主要分为:配置优化、SQL语句优化、任务优化等方案。其中在开发过程中主要涉及到的可能是SQL优化这块。
941 0
|
SQL 分布式计算 HIVE
|
关系型数据库 MySQL 网络安全
5-10Can't connect to MySQL server on 'sh-cynosl-grp-fcs50xoa.sql.tencentcdb.com' (110)")
5-10Can't connect to MySQL server on 'sh-cynosl-grp-fcs50xoa.sql.tencentcdb.com' (110)")
|
SQL 存储 监控
SQL Server的并行实施如何优化?
【7月更文挑战第23天】SQL Server的并行实施如何优化?
910 13