HIVE的搜索结果_文章_第5页-阿里云开发者社区

SelectDB

|

6月前

|

博文

|

来自：数据库

从湖仓分离到湖仓一体，四川航空基于 SelectDB 的多源数据联邦分析实践

川航选择引入 SelectDB 建设湖仓一体大数据分析引擎，取得了数据导入效率提升 3-6 倍，查询分析性能提升 10-18 倍、实时性提升至 5 秒内等收益。

# 云原生数据仓库AnalyticDB MySQL版 # SQL # 分布式计算 # 数据挖掘 # Apache # HIVE

aliyun6039169770-29419

|

6月前

|

博文

|

来自：大数据与机器学习

基于云服务器的数仓搭建-hive/spark安装

本文介绍了在本地安装和配置MySQL、Hive及Spark的过程。主要内容包括： - **MySQL本地安装**：详细描述了内存占用情况及安装步骤，涉及安装脚本的编写与执行，以及连接MySQL的方法。 - **Hive安装**：涵盖了从上传压缩包到配置环境变量的全过程，并解释了如何将Hive元数据存储配置到MySQL中。 - **Hive与Spark集成**：说明了如何安装Spark并将其与Hive集成，确保Hive任务由Spark执行，同时解决了依赖冲突问题。 - **常见问题及解决方法**：列举了安装过程中可能遇到的问题及其解决方案，如内存配置不足、节点间通信问题等。

# 云原生数据仓库AnalyticDB MySQL版 # 云服务器 ECS # SQL # 分布式计算 # 关系型数据库 # HIVE # Spark

技术小达人

|

6月前

|

博文

鹰角基于 Flink + Paimon + Trino 构建湖仓一体化平台实践项目

# 云原生数据仓库AnalyticDB MySQL版 # 实时计算 Flink版 # SQL # 存储 # HIVE # 对象存储 # 流计算

SelectDB

|

7月前

|

博文

|

来自：数据库

数据无界、湖仓无界，Apache Doris 湖仓一体典型场景实战指南（下篇）

Apache Doris 提出“数据无界”和“湖仓无界”理念，提供高效的数据管理方案。本文聚焦三个典型应用场景：湖仓分析加速、多源联邦分析、湖仓数据处理，深入介绍 Apache Doris 的最佳实践，帮助企业快速响应业务需求，提升数据处理和分析效率

# 云原生数据仓库AnalyticDB MySQL版 # SQL # 缓存 # 数据处理 # Apache # HIVE

灵杰开发者

|

7月前

|

博文

|

来自：大数据与机器学习

鹰角基于 Flink + Paimon + Trino 构建湖仓一体化平台实践项目

本文整理自鹰角网络大数据开发工程师朱正军在Flink Forward Asia 2024上的分享，主要涵盖四个方面：鹰角数据平台架构、数据湖选型、湖仓一体建设及未来展望。文章详细介绍了鹰角如何构建基于Paimon的数据湖，解决了Hudi入湖的痛点，并通过Trino引擎和Ranger权限管理实现高效的数据查询与管控。此外，还探讨了湖仓一体平台的落地效果及未来技术发展方向，包括Trino与Paimon的集成增强、StarRocks的应用以及Paimon全面替换Hive的计划。

# 云原生数据仓库AnalyticDB MySQL版 # 云消息队列 Kafka 版 # 云原生大数据计算服务 MaxCompute # 对象存储 # 实时计算 Flink版 # 日志服务 # SQL # 存储 # HIVE # 对象存储 # 流计算

蓝易云

|

7月前

|

博文

hive聚合函数多行合并

通过本文，我们详细介绍了Hive中几种常见的聚合函数及其在多行合并中的具体应用。这些聚合函数在处理和分析大数据时非常有用，可以帮助我们高效地进行数据汇总和处理。希望本文对您的学习和工作有所帮助。

# SQL # 大数据 # HIVE

Echo_Wish

|

7月前

|

博文

|

来自：大数据与机器学习

数据炼金术：从原始数据到商业洞察的五个关键步骤

# 数据采集 # 存储 # SQL # 数据可视化 # HIVE

wiker24

|

7月前

|

博文

|

来自：数据库

【SQL技术】不同数据库引擎 SQL 优化方案剖析

不同数据库系统（MySQL、PostgreSQL、Doris、Hive）的SQL优化策略。存储引擎特点、SQL执行流程及常见操作（如条件查询、排序、聚合函数）的优化方法。针对各数据库，索引使用、分区裁剪、谓词下推等技术，并提供了具体的SQL示例。通用的SQL调优技巧，如避免使用`COUNT(DISTINCT)`、减少小文件问题、慎重使用`SELECT *`等。通过合理选择和应用这些优化策略，可以显著提升数据库查询性能和系统稳定性。

# 云数据库 RDS MySQL 版 # 云原生数据库 PolarDB # 实时计算 Flink版 # SQL # 存储 # 关系型数据库 # HIVE # 索引

技术内容小助手

|

9月前

|

博文

|

来自：大数据与机器学习

Paimon助力数据湖仓架构实时化升级

本次分享由阿里云高级技术专家李劲松介绍Paimon助力数据湖仓架构实时化升级。内容涵盖四个部分：1) 数据架构的存储演进，介绍Data LakeHouse结合的优势；2) Paimon实时数据湖，强调其批流一体和高效处理能力；3) 数据湖的实时流式处理，展示Paimon在时效性提升上的应用；4) 数据湖非结构化处理，介绍Paimon对非结构化数据的支持及AI集成。Paimon通过优化存储格式和引入LSM技术，实现了更高效的实时数据处理和查询性能，广泛应用于阿里巴巴内部及各大公司，未来将进一步支持AI相关功能。

# 云原生数据仓库AnalyticDB MySQL版 # 云消息队列 Kafka 版 # 对象存储 # 实时计算 Flink版 # SQL # 存储 # 分布式计算 # HIVE # 流计算

栈江湖

|

9月前

|

博文

了解Hive 工作原理：Hive 是如何工作的？

Apache Hive 是一个建立在 Hadoop 之上的分布式数据仓库系统，提供类 SQL 查询语言 HiveQL，便于用户进行大规模数据分析。Hive Metastore（HMS）是其关键组件，用于存储表和分区的元数据。Hive 将 SQL 查询转换为 MapReduce 任务执行，适合处理 PB 级数据，但查询效率较低，不适合实时分析。优点包括易于使用、可扩展性强；缺点则在于表达能力有限和不支持实时查询。

# SQL # 存储 # 分布式计算 # Hadoop # HIVE

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

HIVE