分布式计算的搜索结果_热门_第12页-阿里云开发者社区

涂作权

|

博文

MapReduce多个job同时使用的方式(从网上找到的案例，原始博文：http://www.cnblogs.com/yjmyzz/p/4540469.html)

复杂的MapReduce处理中，往往需要将复杂的处理过程，分解成多个简单的Job来执行，第1个Job的输出做为第2个Job的输入，相互之间有一定依赖关系。以上一篇中的求平均数为例，可以分解成三个步骤： 1. 求Sum 2. 求Count 3. 计算平均数每1个步骤看成一个Job，其中Job3必须等待Job1、Job2完成，并将Job1、Job2的输出结果做为输入，下面的代码演示了如何将这3个

# Web App开发 # 分布式计算 # Apache

雨客

|

博文

远程调试Hadoop各组件

# 云数据库 HBase 版 # 分布式计算 # Java # Hadoop # 分布式数据库 # Hbase

岑玉海

|

博文

hbase源码系列（一）Balancer 负载均衡

看源码很久了，终于开始动手写博客了，为什么是先写负载均衡呢，因为一个室友入职新公司了，然后他们遇到这方面的问题，某些机器的硬盘使用明显比别的机器要多，每次用hadoop做完负载均衡，很快又变回来了。

# 云数据库 HBase 版 # 负载均衡 # 存储 # 负载均衡 # 分布式数据库 # Hbase # 算法 # 分布式计算 # Hadoop

小姚同学

|

博文

大数据hadoop环境搭建

# 云原生大数据计算服务 MaxCompute # 云虚拟主机 # 分布式计算 # 大数据 # Java # Hadoop # 开发工具

青衫无名

|

博文

《Spark 官方文档》在YARN上运行Spark

# 资源管理 # 日志服务 # 资源调度 # 分布式计算 # Spark # 容器 # Java # Hadoop # 缓存 # 调度 # 安全 # 存储

skyme

|

博文

Apache Spark三种分布式部署方式比较

# 资源管理 # 分布式计算 # 资源调度 # Apache # 调度 # Spark # 容器 # 运维 # Hadoop # Hbase # 分布式数据库

小猫吃鱼569

|

博文

【Spark Summit EU 2016】基于Spark的分布式计算，提升业务洞察力

本讲义出自Stephan Kessler在Spark Summit EU 2016上的演讲，主要介绍了目前商业智能的相关技术蓝图，并且从业务应用和大数据以及数据科学的角度谈论了目前商业智能蓝图中的不足，并分享了在Spark上集成的业务功能以及如何在Spark上利用不同来源的数据，并对HANA Vora 1.3进行了介绍。

# 云原生大数据计算服务 MaxCompute # 分布式计算 # 大数据 # Spark

隐林

|

博文

|

来自：大数据与机器学习

Alibaba Cloud MaxCompute - Bringing Data to Life

# 云原生大数据计算服务 MaxCompute # 分布式计算 # MaxCompute

午夜漫步者

|

博文

|

来自：大数据与机器学习

带你玩转Logview: MaxCompute Logview参数详解和问题排查

对于Logview上的诸多参数信息，究竟应该怎么“拨开云雾”，发现问题所在呢？又如何通过Logview了解每个instance、task运行状态及资源占用情况，如何分析执行计划，分析query存在问题，找到Long-Tails task，让数据分析业务高效又省钱呢？本文中，阿里巴巴计算平台产品专家云花将为大家揭晓答案。

# 云原生大数据计算服务 MaxCompute # SQL # 分布式计算 # 资源调度 # 调度 # MaxCompute

ysocean

|

博文

RabbitMQ详解（二）------消息通信的概念

　　PS：近期在南宁出差，工作比较忙，所以更新会比较慢。　　说到消息通信，可能我们首先会想到的是邮箱，QQ，微信，短信等等这些通信方式，这些通信方式都有发送者，接收者，还有一个中间存储离线消息的容器。

# 云消息队列 MQ # 消息中间件 # 存储 # 分布式计算 # 网络协议 # Hadoop

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

分布式计算