HIVE的搜索结果_文章-阿里云开发者社区

Echo_Wish

|

4天前

|

博文

|

来自：大数据与机器学习

为什么企业离不开元数据管理？——因为数据混乱，比加班更可怕！

# 数据管理 # SQL # 数据管理 # 大数据 # BI # HIVE

Echo_Wish

|

11天前

|

博文

|

来自：大数据与机器学习

Parquet 和 ORC 到底有啥区别？别再云里雾里了，咱今天把列式存储聊明白！

# SQL # 存储 # 分布式计算 # HIVE # Spark

aliyun8354692999

|

3月前

|

博文

|

来自：大数据与机器学习

四、Sqoop 导入表数据子集

在实际数据导入场景中，我们经常只需要数据库中的一部分数据，比如按条件筛选的行、特定的几列。这篇文章详细讲解了如何使用 Sqoop 的 --where、--columns、--query 等方式灵活实现子集导入，配有完整示例和注意事项，助你更精准地控制数据流向 HDFS 或 Hive。

# SQL # 关系型数据库 # MySQL # 数据库 # HIVE

aliyun8354692999

|

3月前

|

博文

|

来自：大数据与机器学习

三、Sqoop 全量导入核心命令

在大数据处理过程中，数据库表怎么高效导入到 Hadoop？这一篇我带大家实战讲解 Sqoop 全量导入的用法，从基础命令到常用参数配置，再到导入到 HDFS、Hive 的各种格式案例，配合实操示例，帮你一步步掌握全量导入技巧。最后还有练习题，供大家动手巩固一下。

# SQL # 关系型数据库 # MySQL # 数据库 # HIVE

aliyun8354692999

|

3月前

|

博文

|

来自：大数据与机器学习

五、Sqoop 增量导入：精通 Append 与 Lastmodified 模式

在实际业务场景中，数据是不断变化的，怎么用 Sqoop 实现“只拉新增或变化部分”而不是每次全量导入？这一篇就详细讲清楚 Sqoop 增量导入的两种模式（append 和 lastmodified），重点解释 lastmodified 模式下 merge-key 怎么用，配套实战例子和常见坑，讲完你就能搞明白增量同步该怎么配置了。

# SQL # 关系型数据库 # MySQL # Shell # HIVE

SelectDB

|

4月前

|

博文

|

来自：数据库

Apache Doris 2.1.10 版本正式发布

亲爱的社区小伙伴们，Apache Doris 2.1.10 版本已正式发布。2.1.10 版本对湖仓一体、半结构化数据类型、查询优化器、执行引擎、存储管理进行了若干改进优化。欢迎大家下载使用。

# SQL # 存储 # JSON # Apache # HIVE

游客u7dljxi6kiud6

|

4月前

|

博文

从多引擎到统一平台：去哪儿网的 StarRocks 实践

在去哪儿网新一代数据平台架构中，StarRocks 作为统一 OLAP 引擎，替代了原有的 Trino、Presto、Druid、Impala、Kudu、Iceberg、ClickHouse 等多个引擎。如今，去哪儿网 StarRocks 集群覆盖全司业务线，支撑 7 大数据产品，集群规模达数十台，日 PV 突破百万，外表 P95 秒级、内表 P95 毫秒级，性能表现稳定高效。本文将带你走进这一实践过程，解读架构升级背后的思路与成效。

# SQL # 存储 # 运维 # 监控 # HIVE

游客7wkr3y7oxyt7a

|

4月前

|

博文

终于有人把数据架构讲清楚了！

本文深入浅出地解析了数据架构的核心逻辑，涵盖其定义、作用、设计方法及常见误区，助力读者构建贴合业务的数据架构。

# SQL # 数据采集 # 数据处理 # HIVE # 流计算

游客vwx7bav3mqbk6

|

4月前

|

博文

SparkSQL 入门指南：小白也能懂的大数据 SQL 处理神器

在大数据处理的领域，SparkSQL 是一种非常强大的工具，它可以让开发人员以 SQL 的方式处理和查询大规模数据集。SparkSQL 集成了 SQL 查询引擎和 Spark 的分布式计算引擎，使得我们可以在分布式环境下执行 SQL 查询，并能利用 Spark 的强大计算能力进行数据分析。

# 云原生大数据计算服务 MaxCompute # SQL # 分布式计算 # 大数据 # HIVE # Spark

SelectDB

|

5月前

|

博文

|

来自：数据库

网易云信 x Doris：降本70%、提速11倍，统一 ES/InfluxDB/Hive 多技术栈的落地实践

网易云信引入 Apache Doris 统一了原有 Elasticsearch、InfluxDB 和 Hive 多技术栈系统。凭借其高性能和易扩展的特点，提供一站式的数据存储和分析服务。实现机器成本降低 70%、实时场景查询提速 11 倍、离线任务耗时缩短 80% 的显著收益。

# 存储 # SQL # Apache # HIVE # 时序数据库

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

HIVE