HIVE的搜索结果_文章_第5页-阿里云开发者社区

aliyun6039169770-29419

|

8月前

|

博文

|

本文介绍了SeaTunnel的安装与使用教程，涵盖从安装、配置到数据同步的全过程。主要内容包括： 1. **SeaTunnel安装**：详细描述了下载、解压及配置连接器等步骤。 2. **模拟数据到Hive (fake2hive)**：通过编辑测试脚本，将模拟数据写入Hive表。 3. **MySQL到控制台 (mysql2console)**：创建配置文件并执行命令，将MySQL数据输出到控制台。 4. **MySQL到Hive (mysql2hive)**：创建Hive表，配置并启动同步任务，支持单表和多表同步。

# 云数据库 RDS MySQL 版 # SQL # 关系型数据库 # MySQL # 数据库 # HIVE

灵杰开发者

|

8月前

|

博文

|

来自：大数据与机器学习

vivo基于Paimon的湖仓一体落地实践

本文整理自vivo互联网大数据专家徐昱在Flink Forward Asia 2024的分享，基于实际案例探讨了构建现代化数据湖仓的关键决策和技术实践。内容涵盖组件选型、架构设计、离线加速、流批链路统一、消息组件替代、样本拼接、查询提速、元数据监控、数据迁移及未来展望等方面。通过这些探索，展示了如何优化性能、降低成本并提升数据处理效率，为相关领域提供了宝贵的经验和参考。

# 云原生数据仓库AnalyticDB MySQL版 # 实时计算 Flink版 # SQL # 存储 # 消息中间件 # HIVE # 流计算

蓝易云

|

8月前

|

博文

如何在IDE中通过Spark操作Hive

通过以上方法和代码示例，你可以在IDE中成功通过Spark操作Hive，实现大规模数据处理和分析。确保理解每一步的实现细节，应用到实际项目中时能有效地处理各种复杂的数据场景。

# SQL # 分布式计算 # IDE # HIVE # Spark

aliyun6039169770-29419

|

8月前

|

博文

|

来自：大数据与机器学习

基于云服务器的数仓搭建-hive/spark安装

本文介绍了在本地安装和配置MySQL、Hive及Spark的过程。主要内容包括： - **MySQL本地安装**：详细描述了内存占用情况及安装步骤，涉及安装脚本的编写与执行，以及连接MySQL的方法。 - **Hive安装**：涵盖了从上传压缩包到配置环境变量的全过程，并解释了如何将Hive元数据存储配置到MySQL中。 - **Hive与Spark集成**：说明了如何安装Spark并将其与Hive集成，确保Hive任务由Spark执行，同时解决了依赖冲突问题。 - **常见问题及解决方法**：列举了安装过程中可能遇到的问题及其解决方案，如内存配置不足、节点间通信问题等。

# 云原生数据仓库AnalyticDB MySQL版 # 云服务器 ECS # SQL # 分布式计算 # 关系型数据库 # HIVE # Spark

技术小达人

|

8月前

|

博文

鹰角基于 Flink + Paimon + Trino 构建湖仓一体化平台实践项目

# 云原生数据仓库AnalyticDB MySQL版 # 实时计算 Flink版 # SQL # 存储 # HIVE # 对象存储 # 流计算

SelectDB

|

9月前

|

博文

|

来自：数据库

数据无界、湖仓无界，Apache Doris 湖仓一体典型场景实战指南（下篇）

Apache Doris 提出“数据无界”和“湖仓无界”理念，提供高效的数据管理方案。本文聚焦三个典型应用场景：湖仓分析加速、多源联邦分析、湖仓数据处理，深入介绍 Apache Doris 的最佳实践，帮助企业快速响应业务需求，提升数据处理和分析效率

# 云原生数据仓库AnalyticDB MySQL版 # SQL # 缓存 # 数据处理 # Apache # HIVE

灵杰开发者

|

9月前

|

博文

|

来自：大数据与机器学习

鹰角基于 Flink + Paimon + Trino 构建湖仓一体化平台实践项目

本文整理自鹰角网络大数据开发工程师朱正军在Flink Forward Asia 2024上的分享，主要涵盖四个方面：鹰角数据平台架构、数据湖选型、湖仓一体建设及未来展望。文章详细介绍了鹰角如何构建基于Paimon的数据湖，解决了Hudi入湖的痛点，并通过Trino引擎和Ranger权限管理实现高效的数据查询与管控。此外，还探讨了湖仓一体平台的落地效果及未来技术发展方向，包括Trino与Paimon的集成增强、StarRocks的应用以及Paimon全面替换Hive的计划。

# 云原生数据仓库AnalyticDB MySQL版 # 云消息队列 Kafka 版 # 云原生大数据计算服务 MaxCompute # 对象存储 # 实时计算 Flink版 # 日志服务 # SQL # 存储 # HIVE # 对象存储 # 流计算

蓝易云

|

9月前

|

博文

hive聚合函数多行合并

通过本文，我们详细介绍了Hive中几种常见的聚合函数及其在多行合并中的具体应用。这些聚合函数在处理和分析大数据时非常有用，可以帮助我们高效地进行数据汇总和处理。希望本文对您的学习和工作有所帮助。

# SQL # 大数据 # HIVE

Echo_Wish

|

9月前

|

博文

|

来自：大数据与机器学习

数据炼金术：从原始数据到商业洞察的五个关键步骤

# 数据采集 # 存储 # SQL # 数据可视化 # HIVE

wiker24

|

9月前

|

博文

|

来自：数据库

【SQL技术】不同数据库引擎 SQL 优化方案剖析

不同数据库系统（MySQL、PostgreSQL、Doris、Hive）的SQL优化策略。存储引擎特点、SQL执行流程及常见操作（如条件查询、排序、聚合函数）的优化方法。针对各数据库，索引使用、分区裁剪、谓词下推等技术，并提供了具体的SQL示例。通用的SQL调优技巧，如避免使用`COUNT(DISTINCT)`、减少小文件问题、慎重使用`SELECT *`等。通过合理选择和应用这些优化策略，可以显著提升数据库查询性能和系统稳定性。

# 云数据库 RDS MySQL 版 # 云原生数据库 PolarDB # 实时计算 Flink版 # SQL # 存储 # 关系型数据库 # HIVE # 索引

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

HIVE