Hadoop的搜索结果_热门_第5页-阿里云开发者社区

调皮仔3683

|

博文

HDFS应用场景、原理、基本架构

HDFS是什么? 易于扩展的分布式文件系统运行在大量普通廉价机器上，提供容错机制为大量用户提供性能不错的文件存取服务

# 存储 # 缓存 # 分布式计算 # Hadoop # Shell # Java # API # 固态存储 # 资源调度 # C++

寒沙牧

|

博文

|

来自：大数据与机器学习

E-MapReduce集群搭建HAWQ实践

HAWQ是一种基于HDFS的MPP(Massively Parallel Processing) SQL引擎，支持标准SQL/事务处理，性能比原生Hive快几百倍。本文介绍在E-MapReduce集群上面如何搭建HAWQ。

# 开源大数据平台 E-MapReduce # 资源调度 # 分布式计算 # Hadoop # 关系型数据库 # 网络安全

梅熙

|

博文

|

来自：大数据与机器学习

EMR集群上capacity scheduler的ACL实现

本文接着yarn capacity scheduler的实现原理，介绍了capacity scheduler的设置和其中需要注意的问题，并结合EMR集群做了实际操作实验。

# 开源大数据平台 E-MapReduce # 分布式计算 # 大数据 # Hadoop

梅熙

|

博文

|

来自：大数据与机器学习

利用yarn capacity scheduler在EMR集群上实现大集群的多租户的集群资源隔离和quota限制

本文结合EMR集群，讲述了如何利用yarn capacity scheduler在EMR集群上实现大集群的多租户的集群资源quota限制与管控。

# 开源大数据平台 E-MapReduce # 分布式计算 # 资源调度 # 大数据 # Hadoop # 调度

知与谁同

|

博文

pyspark访问hive数据实战

# SQL # 分布式计算 # Hadoop # HIVE # Spark

小猪佩佩

|

博文

常见的七种Hadoop和Spark项目案例

大数据中比较火爆的Hadoop、Spark和Storm，最常见的七种项目你们是否已经了解到位了呢，下面一起了解一下吧一、数据整合称之为“企业级数据中心”或“数据湖”，这个想法是你有不同的数据源，你想对它们进行数据分析。

# 存储 # 分布式计算 # 数据中心 # Spark # Hadoop # 流计算 # Hbase # 分布式数据库 # SQL # HIVE

秦超峰

|

博文

hive数据迁移

比如需要把生产的hive集群数据迁移到另一个集群，hive提供了2个命令工具，可以实现表的批量迁移。 [export/import] 设置默认需要导出的hive数据库在hive目录/etc/alternatives/hive-conf下添加.hiverc vi ~/.hiverc use test; 创建数据临时目录 hdfs dfs -mkdir /tmp/

# SQL # 数据库 # HIVE # Perl # 分布式计算 # Hadoop

祝威廉

|

博文

CarbonData集群模式体验

官方提供了一个快速上手的 Quick-Start ，不过是采用spark-shell local模式的。我这里在实际集群环境做了下测试，并且记录了下过程，希望对大家有所帮助。

# 云数据库 RDS MySQL 版 # SQL # 分布式计算 # Java # HIVE # Spark # Hadoop # 存储 # 数据安全/隐私保护 # 5G # 开发工具

华章计算机

|

博文

《Hadoop与大数据挖掘》——2.5　K-Means算法原理及Hadoop MapReduce实现

# 云原生大数据计算服务 MaxCompute # 分布式计算 # 算法 # 大数据 # 数据挖掘 # Hadoop

轩墨

|

博文

浅谈公安大数据的建设

# 云原生大数据计算服务 MaxCompute # 存储 # 分布式计算 # 大数据 # Hadoop # 数据挖掘

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Hadoop