分布式计算的搜索结果_热门_第7页-阿里云开发者社区

木洛

|

博文

|

使用DataX同步MaxCompute数据到TableStore（原OTS）优化指南

概述现在越来越多的技术架构下会组合使用MaxCompute和TableStore，用MaxCompute作大数据分析，计算的结果会导出到TableStore提供在线访问。MaxCompute提供海量数据计算的能力，而TableStore提供海量数据高并发低延迟读写的能力。

# 云原生大数据计算服务 MaxCompute # 表格存储 # 数据集成 Data Integration # 分布式计算 # NoSQL # Java # DataX # MaxCompute

May-Hologres

|

博文

来了，2行代码秒级查询MaxCompute！

今天小编就来为大家讲解，使用HoloStudio，用最少的代码，最快的查询MaxCompute中的数据，既解放了双手，又实现了数据的秒级交互响应，两全其美！

# 云原生大数据计算服务 MaxCompute # 大数据开发治理平台 DataWorks # SQL # 分布式计算 # DataWorks # MaxCompute # 调度 # 存储 # 关系型数据库 # API

开源大数据EMR

|

博文

|

来自：大数据与机器学习

在 Apache Spark 中利用 HyperLogLog 函数实现高级分析

预聚合是高性能分析中的常用技术，通过预先聚合降低纬度，从而在查询时大幅减少计算量，提升响应速度。本文介绍了 spark-alchemy 这个开源库中的 HyperLogLog 这一个高级功能，并且探讨它是如何解决大数据中数据聚合的问题。

# 开源大数据平台 E-MapReduce # 云原生大数据计算服务 MaxCompute # 分布式计算 # Spark # 大数据 # 算法 # Apache

黄晓萌

|

博文

Schedulerx2.0分布式计算原理&最佳实践

1. 前言 Schedulerx2.0的客户端提供分布式执行、多种任务类型、统一日志等框架，用户只要依赖schedulerx-worker这个jar包，通过schedulerx2.0提供的编程模型，简单几行代码就能实现一套高可靠可运维的分布式执行引擎。

# 分布式计算 # 并行计算 # 数据库 # 容器

隐林

|

博文

|

来自：大数据与机器学习

标签分类理论

最近在做DMP，负责设计一套标签管理系统。在对现有标签进行整理的过程中，整理出了这套东西。 0. 标签的定义：标签分类学(Taxonomy) 对于标签(tag)，很难列出一个公认的定义，指明这个概念的种差与属概念。所以为了把握这个概念，就需要采取定义另一种办法：分类与枚举。我们要解决的第一个

# 云原生大数据计算服务 MaxCompute # 存储 # JSON # 分布式计算 # MaxCompute # 数据格式

付帅

|

博文

Hadoop数据迁移MaxCompute最佳实践

本文向您详细介绍如何通过使用DataWorks数据同步功能，将Hadoop数据迁移到阿里云MaxCompute大数据计算服务上。您也可以参考本文进行MaxCompute数据到Hadoop的反向迁移。

# 云原生大数据计算服务 MaxCompute # 专有网络VPC # 云服务器 ECS # 大数据开发治理平台 DataWorks # 数据集成 Data Integration # 分布式计算 # DataWorks # Hadoop # Java # 测试技术

海清

|

博文

|

来自：大数据与机器学习

数据库工程师快速上手MaxCompute进行ETL

案例说明本案例主要是介绍如何通过数加MaxCompute+大数据开发套件两个产品实现简单的网站数据统计分析。适用人群 MaxCompute初学者，特别是无大数据开发基础但有数据库使用基础。案例侧重数据库工程师快速上手MaxCompute进行大数据开发，简单了解在MaxCompute做大数据ETL过程，同时了解一些MaxCompute SQL和常用数据库SQL的基本区别。

# 云原生大数据计算服务 MaxCompute # 数据集成 Data Integration # 云数据库 RDS MySQL 版 # SQL # 分布式计算 # 大数据 # MaxCompute # 数据库

隐林

|

博文

|

来自：大数据与机器学习

MaxCompute常用语句汇总(更新ing)

收集一些MaxCompute常用命令。

# 云原生大数据计算服务 MaxCompute # SQL # 分布式计算 # 大数据 # MaxCompute

wuyudong

|

博文

hadoop2.6完全分布式安装HBase1.1

# 微服务引擎 # 云数据库HBase版 # 分布式计算 # Hadoop # 分布式数据库 # Hbase # Shell

小猫吃鱼569

|

博文

【Spark Summit East 2017】使用Spark进行时间序列分析

本讲义出自Simon Ouellette在Spark Summit East 2017上的演讲，主要介绍了在Spark上与时间序列数据进行交互的Scala / Java / Python库——spark-timeseries，演讲中分享了spark-timeseries的总体设计，目前实现的功能，并将提供一些用法示例。

# 分布式计算 # 大数据 # Java # Spark # Python

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

分布式计算