Hadoop的搜索结果_热门_第10页-阿里云开发者社区

涂作权

|

博文

Hadoop-2.8.0集群搭建、hadoop源码编译和安装、host配置、ssh免密登录、hadoop配置文件中的参数配置参数总结、hadoop集群测试,安装过程中的常见错误

25. 集群搭建 25.1 HADOOP集群搭建 25.1.1集群简介 HADOOP集群具体来说包含两个集群：HDFS集群和YARN集群，两者逻辑上分离，但物理上常在一起 HDFS集群：负责海量数据的存储，集群中的角色主要有NameNode / DataNode YARN集群：负责海量数据运算时的资源调度，集群中的角色主要有 ResourceManager /NodeManag

# 日志服务 # 微服务引擎 # 分布式计算 # Java # Hadoop # 测试技术 # Apache

xiaoqb

|

博文

DB-Engines 11 月最新数据库排名

# SQL # NoSQL # 数据库 # 数据库管理 # Redis # 关系型数据库 # Oracle # MySQL # 分布式计算 # Hadoop

北斗云

|

博文

Apache Druid安装部署

一.Apache Druid简述 Apache Druid是MetaMarket公司研发，专门为做海量数据集上的高性能OLAP（OnLine Analysis Processing）而设计的数据存储和分析系统，目前在Apache基金会下孵化。

# 云数据库 RDS MySQL 版 # 分布式计算 # druid # Hadoop # 关系型数据库 # Apache

封神

|

博文

|

来自：大数据与机器学习

为什么选择ali-E-MapReduce

E-MapReduce是构建于阿里云ECS弹性虚拟机之上，利用开源大数据生态系统，包括但不限于Hadoop、Spark、Hbase，为用户提供集群、作业、数据等管理的一站式大数据处理分析服务。我们提供的软件基本都是开源的软件，会有一些性能的优化，但是绝对不引入任何不兼容的改动。

# 开源大数据平台 E-MapReduce # 云原生大数据计算服务 MaxCompute # 弹性计算 # 分布式计算 # 大数据 # Hadoop

泰山不老生

|

博文

Linux下Hadoop2.6.0集群环境的搭建

本文旨在提供最基本的，可以用于在生产环境进行Hadoop、HDFS、Hbase分布式环境的搭建，对自己是个总结和整理，也能方便新人学习使用。

# 分布式计算 # Hadoop # 大数据 # Java # Shell

skyme

|

博文

基于java的分布式爬虫

# 数据采集 # 算法 # Java # 定位技术 # 监控 # 调度 # 分布式计算 # Hadoop # 自然语言处理

冶善

|

博文

|

来自：大数据与机器学习

如何在MaxCompute上运行HadoopMR作业

MaxCompute（原ODPS）有一套自己的MapReduce编程模型和接口，简单说来，这套接口的输入输出都是MaxCompute中的Table，处理的数据是以Record为组织形式的，它可以很好地描述Table中的数据处理过程，然而与社区的Hadoop相比，编程接口差异较大。Hadoop用户如果

# 云原生大数据计算服务 MaxCompute # 分布式计算 # Hadoop # Java # MaxCompute

开源大数据EMR

|

博文

|

来自：大数据与机器学习

阿里云大数据+AI技术沙龙上海站回顾 | 揭秘TPC-DS 榜单第一名背后的强大引擎

11月16日的大数据+AI沙龙上海站取得圆满成功！ EMR 团队在国内运营最大的 Spark 社区，为了更好地传播和分享业界最新技术和最佳实践，现在联合开源社区同行，打造一个纯粹的技术交流线下沙龙《大数据 + AI》，定期为大家做公益分享。本次分享，揭秘TPC-DS 榜单第一名背后的强大引擎，探索Pyboot如何打通大数据生态，一同学习业内最新的存储方案和机器学习平台。

# 云原生大数据计算服务 MaxCompute # 开源大数据平台 E-MapReduce # 分布式计算 # 大数据 # Spark # Apache # Hadoop # 人工智能

风火数据

|

博文

Hadoop大数据面试题（全）

以下资料来源于互联网，很多都是面试者们去面试的时候遇到的问题，我对其中有的问题做了稍许的修改了回答了部分空白的问题，其中里面有些考题出的的确不是很好，但是也不乏有很好的题目，这些都是基于真实的面试来的，希望对即将去面试或向...

# 云原生大数据计算服务 MaxCompute # 日志服务 # 云数据库 RDS MySQL 版 # 微服务引擎 # 云数据库 HBase 版 # 云解析DNS # 存储 # SQL # 分布式计算 # 大数据 # Hadoop

周志湖

|

博文

Spark修炼之道（高级篇）——Spark源码阅读：第二节 SparkContext的创建

博文推荐：http://blog.csdn.net/anzhsoft/article/details/39268963，由大神张安站写的Spark架构原理，使用Spark版本为1.2，本文以Spark 1.5.0为蓝本，介绍Spark应用程序的执行流程。本文及后面的源码分析都以下列代码为样板 import org.apache.spark.{SparkConf, S

# 资源管理 # 分布式计算 # 资源调度 # Spark # 调度 # Hadoop # Apache

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Hadoop