待补充

简介: 待补充
–分区
–开启动态分区
SET hive.exec.dynamic.partition=true;
–开启非严格模式
SET hive.exec.dynamic.partition.mode=nonstrict;
set hive.exec.max.dynamic.partitions.pernode=10000;
set hive.exec.max.dynamic.partitions=100000;
set hive.exec.max.created.files=150000;
–hive压缩
set hive.exec.compress.intermediate=true;
set hive.exec.compress.output=true;
–写入时压缩生效
set hive.exec.orc.compression.strategy=COMPRESSION;
–分桶
set hive.enforce.bucketing=true;
set hive.enforce.sorting=true;
set hive.optimize.bucketmapjoin = true;
set hive.auto.convert.sortmerge.join=true;
set hive.auto.convert.sortmerge.join.noconditionaltask=true;
–并行执行
set hive.exec.parallel=true;
set hive.exec.parallel.thread.number=8;
–小文件合并
– set mapred.max.split.size=2147483648;
– set mapred.min.split.size.per.node=1000000000;
– set mapred.min.split.size.per.rack=1000000000;
–矢量化查询
set hive.vectorized.execution.enabled=true;
–关联优化器
set hive.optimize.correlation=true;
–读取零拷贝
set hive.exec.orc.zerocopy=true;
–join数据倾斜
set hive.optimize.skewjoin=true;
– set hive.skewjoin.key=100000;
set hive.optimize.skewjoin.compiletime=true;
set hive.optimize.union.remove=true;
– group倾斜
set hive.groupby.skewindata=true;
目录
相关文章
|
11月前
|
存储 固态存储 数据库
|
人工智能 供应链 算法
通过MES系统,企业实现智能生产排产
MES系统源码,云MES系统全套源码。MES系统是连接企业计划管理系统(如ERP)与工业控制系统的桥梁,实现生产过程的数字化、透明化和智能化。其核心功能包括数据集成与实时采集、智能分析与优化算法、动态调度与调整、生产预测与趋势分析、可视化排产界面、质量控制与供应链优化,并集成物联网、AI及云技术,显著提升生产效率和响应速度,是智能制造的关键技术。
334 3
通过MES系统,企业实现智能生产排产
|
分布式计算 DataWorks 安全
DataWorks产品使用合集之在DataWorks中,冒烟测试在环境测试如何解决
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
173 0
|
JavaScript
【UI】 elementUI的select-tree组合下拉框,选择后下拉框不收起
【UI】 elementUI的select-tree组合下拉框,选择后下拉框不收起
577 1
|
数据挖掘 PyTorch 算法框架/工具
Transformers 4.37 中文文档(八十六)(3)
Transformers 4.37 中文文档(八十六)
82 4
|
SQL 存储 资源调度
Hive3新特性 2
Hive3新特性
339 0
Hive3新特性 2
|
存储 消息中间件 数据可视化
Dataphin实时研发实践—电商场景下的实时数据大屏构建
实时数据大屏是实时计算的重要应用场景之一,广泛应用在电商业务中,用于实时监控和分析电商平台的运营情况。通过大屏展示实时的销售额、订单量、用户活跃度、商品热度等数据指标,帮助业务人员随时了解业务的实时状态,快速发现问题和机会。同时,通过数据可视化和趋势分析,大屏也提供了决策支持和优化运营的功能,帮助业务人员做出及时的决策和调整策略,优化电商业务的运营效果。 下面以电商业务为背景,介绍如何构建经典实时数仓,实现实时数据从业务库到ODS层、DWD层、DWS层全链路流转,基于Dataphin和Quick BI实现实时数据大屏。
966 0
|
SQL 分布式计算 Hadoop
Hive3新特性 1
Hive3新特性
380 0
|
存储 编译器 C语言
C生万物 | 指针进阶 · 炼狱篇-3
C生万物 | 指针进阶 · 炼狱篇
123 0
|
安全 数据安全/隐私保护 Python
Python应用之验证码验证
用户登录网站经常需要输入验证码,验证码包含大小写字母和数字,随机出现。用户输入验证码时不区分大小写,只要各字符出现顺序正确即可通过验证。   请写一个程序完成验证码的匹配验证,随机生成四位数的验证码如Qs2X(生成数字概率为1/5,大写字母和小写字母概率各为2/5) 如果用户输入验证码正确,输出“验证码正确”,输入错误时输出“验证码错误,请重新输入”,再重新生成验证码让用户输入,输入五次错误时输出“您已用光了验证机会”。
810 0