Hadoop的搜索结果_文章-阿里云开发者社区

Echo_Wish

|

17天前

|

博文

|

来自：大数据与机器学习

到底该选谁？Hadoop、Spark、Flink、云大数据的“江湖全景图”

# 分布式计算 # Hadoop # 大数据 # 流计算 # Spark

Echo_Wish

|

18天前

|

博文

|

来自：大数据与机器学习

从“攒一锅再算”到“来一条就干一条”：大数据批处理到流处理的进化之路

# 分布式计算 # 大数据 # Hadoop # 流计算 # Spark

游客u7dljxi6kiud6

|

2月前

|

博文

|

来自：数据库

告别 Hadoop，拥抱 StarRocks！政采云数据平台升级之路

政采云平台作为政府采购数字化的创新典范，集监管、交易、服务于一体，经过近九年的发展，已成为行业内服务范围最广、用户数量最多、交易最活跃、监管产品最丰富的跨区域、跨层级、跨领域的一体化采购云服务平台，日均处理海量高并发数据。Hadoop 作为早期构建大规模数据平台的基石，为政采云平台打开了低成本处理海量非结构化、半结构化数据的可能。然而，伴随业务激增、复杂分析需求及严苛的时效要求，曾经“功臣”的局限性和沉重包袱日益凸显，逐渐成为数据价值释放的“枷锁”。

# 云原生大数据计算服务 MaxCompute # 存储 # SQL # 分布式计算 # 运维 # Hadoop

计算机程序设计Y2013070224

|

2月前

|

博文

基于Python大数据的的电商用户行为分析系统

本系统基于Django、Scrapy与Hadoop技术，构建电商用户行为分析平台。通过爬取与处理海量用户数据，实现行为追踪、偏好分析与个性化推荐，助力企业提升营销精准度与用户体验，推动电商智能化发展。

# 云原生大数据计算服务 MaxCompute # 存储 # 分布式计算 # 大数据 # Hadoop # Python

一枚后端工程狮

|

2月前

|

博文

《聊聊分布式》ZooKeeper与ZAB协议：分布式协调的核心引擎

ZooKeeper是一个开源的分布式协调服务，基于ZAB协议实现数据一致性，提供分布式锁、配置管理、领导者选举等核心功能，具有高可用、强一致和简单易用的特点，广泛应用于Kafka、Hadoop等大型分布式系统中。

# 微服务引擎 # 消息中间件 # 分布式计算 # 资源调度 # Hadoop # Kafka

aliyun8354692999

|

2月前

|

博文

|

来自：大数据与机器学习

七、Sqoop Job：简化与自动化数据迁移任务及免密执行

平时用 Sqoop 导入导出时，命令一长就容易出错，特别是增量任务还得记 last-value，很麻烦。其实 Sqoop 有 Job 功能，能把命令“存档”，以后直接 --exec 执行，配合调度工具特别省心。本文手把手讲 Job 创建、管理、免密执行技巧（密码文件、Credential Provider），还带实战例子，搞完你就能写出稳稳当当的自动化 Sqoop 作业了！

# 存储 # 分布式计算 # Hadoop # 关系型数据库 # 数据安全/隐私保护

aliyun8354692999

|

3月前

|

博文

|

来自：大数据与机器学习

一、Sqoop历史发展及原理

在大数据系统中，Sqoop 就像是一位干练的“数据搬运工”，帮助我们把 MySQL、Oracle 等数据库里的数据快速、安全地导入到 Hadoop、Hive 或 HDFS 中，反之亦然。这个专栏从基础原理讲起，配合实战案例、参数详解和踩坑提醒，让你逐步掌握 Sqoop 的使用技巧。不管你是初学者，还是正在构建数据管道的工程师，都能在这里找到实用的经验和灵感。

# 分布式计算 # 关系型数据库 # Hadoop # Java # 数据库

aliyun8354692999

|

3月前

|

博文

|

来自：大数据与机器学习

二、Sqoop 详细安装部署教程

在大数据开发实战中，Sqoop 是数据库与 Hadoop 生态之间不可或缺的数据传输工具。这篇文章将以 Sqoop 1.4.7 为例，结合官方站点截图，详细讲解 Sqoop 的下载路径、安装步骤、环境配置，以及常见 JDBC 驱动的准备过程，帮你一步步搭建出能正常运行的 Sqoop 环境，并通过 list-databases 命令验证安装是否成功。如果你正打算学习 Sqoop，或者在搭建大数据平台过程中遇到安装配置问题，本文将是非常实用的参考指南。

# 分布式计算 # Java # 关系型数据库 # Hadoop # 数据库连接

瓴羊Dataphin

|

3月前

|

博文

终于！大数据分析不用再“又要快又要省钱”二选一了！Dataphin新功能太香了！

Dataphin推出查询加速新功能，支持用StarRocks等引擎直连MaxCompute或Hadoop查原始数据，无需同步、秒级响应。数据只存一份，省成本、提效率，权限统一管理，打破“又要快又要省”的不可能三角，助力企业实现分析自由。

# 存储 # SQL # 分布式计算 # Hadoop # MaxCompute

赵渝强老师

|

4月前

|

博文

|

来自：大数据与机器学习

【赵渝强老师】Hadoop HDFS的快照

Hadoop HDFS快照是文件系统或目录在某一时刻的镜像，提供备份机制，适用于防止错误操作、备份数据、测试环境搭建及灾难恢复等场景。通过管理员命令可开启目录快照功能，并使用操作命令创建、删除、重命名快照。文章演示了具体操作步骤，包括创建两个快照并进行对比，展示了如何通过命令行和Web Console查看快照信息。

# 分布式计算 # Hadoop # 测试技术

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Hadoop