大数据与机器学习-博文-阿里云开发者社区

傲海

|

机器学习/深度学习算法对象存储

|

博文

【玩转数据系列十】利用阿里云机器学习在深度学习框架下实现智能图片分类

伴随着今日阿里云机器学习PAI在云栖大会的重磅发布，快来感受下人工智能的魅力。一、背景随着互联网的发展，产生了大量的图片以及语音数据，如何对这部分非结构化数据行之有效的利用起来，一直是困扰数据挖掘工程师的一到难题。

50627 63 135

来自：人工智能平台PAI 版块

付空

|

消息中间件存储供应链

|

博文

数据仓库介绍与实时数仓案例

1.数据仓库简介数据仓库是一个面向主题的（Subject Oriented）、集成的（Integrate）、相对稳定的（Non-Volatile）、反映历史变化（Time Variant）的数据集合，用于支持管理决策。

45333 237 253

来自：实时计算 Flink 版块

尼不要逗了

|

分布式计算算法大数据

|

博文

分布式快照算法: Chandy-Lamport

Spark 的 Structured Streaming 的 Continuous Processing Mode 的容错处理使用了分布式快照（Distributed Snapshot）算法 Chandy-Lamport 算法，那么分布式快照算法可以用来解决什么问题呢？

25204 70 71

来自：开源大数据平台 E-MapReduce 版块

隐林

|

分布式计算 MaxCompute

|

博文

MaxCompute执行作业慢的原因排查

大家在平时开发过程中经常遇到作业（SQL、MR等）执行慢的原因，今天带大家一起学习自排查方法。 1、wait wait ，job querying 遇到这个提示，就是资源出现了排队，如果你是后付费用户，那就是整个后付费的共享池已经没有富余的资源了，要等前一个作业处理完。

26183 5 7

来自：大数据计算 MaxCompute 版块

隐林

|

分布式计算大数据 BI

|

博文

阿里云MaxCompute（大数据）公开数据集---带你玩转人工智能

目前阿里云大数据产品已经免费向全部用户开放了多种公用数据集。开放的数据类别包括：股票价格数据，房产信息，影视及其票房数据。

26294 5 12

来自：大数据计算 MaxCompute 版块

傲海

|

机器学习/深度学习 TensorFlow 算法框架/工具

|

博文

【玩转数据系列十五】机器学习PAI为你自动写歌词，妈妈再也不用担心我的freestyle了（提供数据、代码）

背景最近互联网上出现一个热词就是“freestyle”，源于一个比拼rap的综艺节目。在节目中需要大量考验选手的freestyle能力，freestyle指的是rapper即兴的根据一段主题讲一串rap。

21173 3 16

来自：人工智能平台PAI 版块

隐林

|

弹性计算分布式计算 Hadoop

|

博文

[大数据新手上路]“零基础”系列课程--如何将ECS上的Hadoop数据迁移到阿里云数加·MaxCompute

想用阿里云数加·大数据计算服务（MaxCompute），但是现在数据还在hadoop上，怎么办？别烦恼，跟着我们走，来一次MaxCompute零基础数据迁移之旅～Let’s Go！

16909 0 0

来自：大数据计算 MaxCompute 版块

隐林

|

存储分布式计算搜索推荐

|

博文

干货：解码OneData，阿里的数仓之路。

据IDC报告，预计到2020年全球数据总量将超过40ZB(相当于4万亿GB)，这一数据量是2013年的10倍。正在“爆炸式”增长的数据的潜在巨大价值正在被发掘，它有可能成为商业世界的“新能源”，变革我们的生产，影响我们生活。当我们面对如此庞大的数据之时，如果我们不能有序、有结构的进行分类组织

22080 2 4

来自：大数据计算 MaxCompute 版块

晋恒

|

大数据分布式计算安全

|

博文

混合云模式下 MaxCompute + Hadoop 混搭大数据架构实践

2019杭州云栖大会大数据企业级服务专场，由斗鱼大数据高级专家张龙带来以 “混合云模式下 MaxCompute+Hadoop 混搭大数据架构实践” 为题的演讲。本文讲述了从 Apache Hadoop 阶段到 Cloudera CDH 阶段斗鱼大数据架构的发展历程。提出了上云过程中斗鱼遇到的问题和跳战，包括数据安全、数据同步以及迁移任务。概括了混合云模式给斗鱼带来资源效率更高和资源成本更低的变化。

16420 2 2

来自：大数据计算 MaxCompute 版块

傲海

|

机器学习/深度学习 SQL 分布式计算

|

博文

【玩转数据系列一】人口普查统计案例

玩转数据系列文章通过简单地案例搭建，介绍如何通过阿里云机器学习平台进行数据挖掘。

17234 1 1

来自：人工智能平台PAI 版块

开源大数据EMR

|

对象存储存储分布式计算

|

博文

JindoFS解析 - 云上大数据高性能数据湖存储方案

JindoFS 是云原生的文件系统，可以提供OSS 超大容量以及本地磁盘的性能

15690 0 1

来自：开源大数据平台 E-MapReduce 版块

傲海

|

机器学习/深度学习算法搜索推荐

|

博文

【玩转数据系列十三】机器学习算法基于信用卡消费记录做信用评分

机器学习算法基于信用卡消费记录做信用评分背景如果你是做互联网金融的，那么一定听说过评分卡。评分卡是信用风险评估领域常用的建模方法，评分卡并不简单对应于某一种机器学习算法，而是一种通用的建模框架，将原始数据通过分箱后进行特征工程变换，继而应用于线性模型进行建模的一种方法。

15576 1 3

来自：人工智能平台PAI 版块

隐林

|

存储运维监控

|

博文

阿里云大数据计算平台的自动化、精细化运维之路

作者简介：　　范伦挺　　阿里巴巴基础架构事业群-技术专家　　花名萧一，2010年加入阿里巴巴，现任阿里巴巴集团大数据计算平台运维负责人。团队主要负责阿里巴巴各类离在线大数据计算平台（如MaxCompute、AnalyticDB、StreamComput

12725 0 0

来自：大数据计算 MaxCompute 版块

开发者说

|

运维监控数据挖掘

|

博文

重磅首发 |《Elasticsearch 中国开发者调查报告》探索开发者的现状和未来

为了了解Elasticsearch 中国开发者群体，结合1186位开发者的调研数据和18位社区专家的深度访谈，Elastic 技术社区、阿里巴巴 Elasticsearch 技术团队和阿里云开发者社区联合发布了《Elasticsearch 中国开发者调查报告》。免费下载，抢先一步读懂这个“族群”吧。

84998 0 7

来自：检索分析服务 Elasticsearch版版块

开源大数据EMR

|

Web App开发 SQL 监控

|

博文

开源大数据周刊-第90期

9964 0 1

来自：开源大数据平台 E-MapReduce 版块

小蚂蚁啃骨头

|

机器学习/深度学习 SQL 人工智能

|

博文

阿里大航杯AI电力大赛比赛分享及数加平台，机器学习pai使用经验

本文主要以阿里云大航杯“智造扬中”电力AI大赛数据为背景，讲述博主自己的比赛经历以及数加平台和机器学习pai的使用经验

11399 1 18

来自：人工智能平台PAI 版块

隐林

|

存储搜索推荐数据库

|

博文

细数阿里云服务器的十二种典型应用场景

文章转载：小白杨1990 如今，阿里云的产品可谓是多种多样，纷繁复杂。面对各种各样的技术和产品，ECS、RDS、OSS…等等一系列的东西，很容易让人找不到头绪，尤其是刚刚开始接触网站建设的朋友。阿里云湖北授权服务中心武汉捷讯结合阿里云官网的资料，针对建站相关的内容为大家整理一些阿里云典型的应用场景

11372 1 2

来自：大数据计算 MaxCompute 版块

工程师甲

|

监控安全数据安全/隐私保护

|

博文

【X-Pack解读】阿里云Elasticsearch X-Pack 安全组件功能详解

阿里云Elasticsearch集成了Elastic Stack商业版的X-Pack组件包，包括安全、告警、监控、报表生成、图分析、机器学习等组件，用户可以开箱即用。接下来小编将在【X-Pack解读】系列里解读各个Elasticsearch X-Pack 组件功能。

11783 0 0

来自：检索分析服务 Elasticsearch版版块

勿烦

|

SQL 分布式计算 MaxCompute

|

博文

SQL优化器原理 - Auto Hash Join

在MaxCompute中，Join操作符的实现算法之一名为"Hash Join"，其实现原理是，把小表的数据全部读入内存中，并拷贝多份分发到大表数据所在机器，在 map 阶段直接扫描大表数据与内存中的小表数据进行匹配。

9699 0 0

来自：大数据计算 MaxCompute 版块

继盛

|

机器学习/深度学习分布式计算算法

|

博文

Mars——基于张量的统一分布式计算框架

很高兴在这里宣布我们的新项目：Mars，一个基于张量的统一分布式计算框架。我们已经在 Github 开源：https://github.com/mars-project/mars 。背景 Python Python 是一门相当古老的语言了，如今，在数据科学计算、机器学习、以及深度学习领域，Python 越来越受欢迎。

12904 0 2

来自：大数据计算 MaxCompute 版块

工程师甲

|

监控大数据索引

|

博文

【X-Pack解读】阿里云Elasticsearch X-Pack 监控组件功能详解

阿里云Elasticsearch集成了Elastic Stack商业版的X-Pack组件包，包括安全、告警、监控、报表生成、图分析、机器学习等组件，用户可以开箱即用。本文将对X-Pack 的监控组件功能进行详细解读。

10432 1 1

来自：检索分析服务 Elasticsearch版版块

阿里云实时计算Flink

|

SQL 流计算

|

博文

Flink SQL 功能解密系列 —— 数据去重的技巧和思考

去重逻辑在业务处理中使用广泛，大致可以分两类：DISTINCT去重和FIRST_VALUE主键去重，两者的区别是DISTINCT去重是对整行数据进行去重，比如tt里面数据可能会有重复，我们要去掉重复的数据；FIRST_VALUE是根据主键进行去重，可以看成是一种业务层面的去重，但是真实的业务场景使用也很普遍，比如一个用户有多次点击，业务上只需要取第一条。

11711 0 1

来自：实时计算 Flink 版块

隐林

|

存储分布式计算大数据

|

博文

阿里巴巴大数据实践之数据建模

随着DT时代互联网、智能设备及其他信息技术的发展，数据爆发式增长，如何将这些数据进行有序、有结构地分类组织和存储是我们面临的一个挑战。为什么需要数据建模如果把数据看作图书馆里的书，我们希望看到它们在书架上分门别类地放置；如果把数据看作城市的建筑，我们希望城市规划布局合理；如果把数据看作电脑文件和文件夹，我们希望按照自己的习惯有很好的文件夹组织方式，而不是糟糕混乱的桌面，经常为找一个文件而不知所措。

7723 0 1

来自：大数据计算 MaxCompute 版块

开源大数据EMR

|

存储消息中间件大数据

|

博文

开源大数据周刊-第66期

6808 0 0

来自：开源大数据平台 E-MapReduce 版块

双歧

|

负载均衡微服务 Perl

|

博文

istio网络转发分析

通过demo分析istio的网络转发流程，从而对istio实现原理有更为直观的认识。本文先介绍了涉及到的相关概念和背景知识，然后对具体应用进行分析。背景知识概念分散，参考文章较多，敬请谅解。

9097 0 0

来自：智能搜索推荐版块

金竹

|

消息中间件 Java Kafka

|

博文

Apache Flink 漫谈系列(15) - DataStream Connectors之Kafka

聊什么为了满足本系列读者的需求，在完成《Apache Flink 漫谈系列(14) - DataStream Connectors》之前，我先介绍一下Kafka在Apache Flink中的使用。所以本篇以一个简单的示例，向大家介绍在Apache Flink中如何使用Kafka。

9370 57 62

来自：实时计算 Flink 版块

祎休

|

分布式计算大数据测试技术

|

博文

从未停止进化的MaxCompute

2017云栖大会·杭州峰会将于10月10日-14日在杭州云栖小镇隆重举行，据相关数据显示大会多场主题分论坛门票都已经售罄。在这110余场主题分论坛中，可能备受大家最为感兴趣是人工智能、大数据的专场。大数据的热度在深圳峰会、成都峰会、上海峰会都逐一印证。

6601 0 0

来自：大数据计算 MaxCompute 版块

祎休

|

SQL 分布式计算大数据

|

博文

MaxCompute（原ODPS）开发入门指南——计量计费篇

近期介绍大量数据上云用户关于MaxCompute的一些问题，现就MaxCompute产品线的一些工具栈可以和大家进行交流，也欢迎大家拍砖和来扰，一起学习一起进步！也希望能够在帮助到大家！

7429 0 2

来自：大数据计算 MaxCompute 版块

隐林

|

SQL 分布式计算 MaxCompute

|

博文

从MapReduce的执行来看如何优化MaxCompute（原ODPS） SQL

SQL基础有这些操作（按照执行顺序来排列）： from join(left join, right join, inner join, outer join ,semi join) where group by select sum distinct count order by 如果我们能理解mapreduce是怎么实现这些SQL中的基本操作的，那么我们将很容易理解怎么优化SQL写法。

7377 0 0

来自：大数据计算 MaxCompute 版块

晋恒

|

Web App开发 SQL 分布式计算

|

博文

阿里云MaxCompute 2019-4月刊

4月新功能发布，精彩技术好文推荐，5月线上线下活动抢先知道，尽在4月刊。

5919 0 0

来自：大数据计算 MaxCompute 版块

继盛

|

分布式计算关系型数据库数据库

|

博文

PyODPS DataFrame：统一的数据查询语言

前几天，PyODPS发布了0.7版本，这篇文章给大家介绍下PyODPS新版本带来的重要特性。之前也有若干篇文章介绍过了，我们PyODPS DataFrame是延迟执行的，在调用立即执行的方法，比如execute、persist等之前，都只是构建了表达式。

6926 0 1

来自：大数据计算 MaxCompute 版块

隐林

|

机器学习/深度学习人工智能并行计算

|

博文

阿里云机器学习平台PAI，助力降低机器学习的成本和技术门槛

摘要：在2017杭州云栖大会机器学习平台PAI专场上，阿里巴巴研究员、阿里云机器学习平台PAI负责人林伟为大家分享了人工智能的发展历史以及阿里云机器学习平台PAI的简单情况和特性。本文内容根据嘉宾演讲视频以及PPT整理而成。

7003 1 1

来自：人工智能平台PAI 版块

zongyuanwu

|

XML 存储算法

|

博文

BasicEngine — 基于DII平台的推荐召回引擎

BasicEngine是阿里巴巴搜索事业部自研的推荐在线召回引擎，依托强大的搜索底层技术支持，可以在线实现复杂的关联排序运算，支持灵活的推荐策略组合，为推荐系统的升级发展拓展了无限想象空间。

9007 0 0

来自：智能搜索推荐版块

阿里云E-MapReduce团队

|

SQL 应用服务中间件对象存储

|

博文

玩转阿里云EMR三部曲-高级篇交互式查询及统一数据源

利用阿里云EMR生态定制化集群，实现数据仓库满足商业/运营的查询需求，并提供横向扩展提升性能的空间，结合多样服务达到数据交互查询及统一数据源下的最佳成本控制。

6489 0 0

来自：开源大数据平台 E-MapReduce 版块

阿里云实时计算Flink

|

机器学习/深度学习消息中间件存储

|

博文

携程实时智能检测平台建设实践

rophet基本覆盖了携程所有业务线，监控指标的数量达到10K+，覆盖了携程所有订单、支付等重要的业务指标。Prophet将时间序列的数据作为数据输入，以监控平台作为接入对象，以智能告警实现异常的告警功能，并基于Flink实时计算引擎来实现异常的实时预警，提供一站式异常检测解决方案。

6252 0 0

来自：实时计算 Flink 版块

工程师甲

|

分布式计算 Hadoop DataWorks

|

博文

【最佳实践】如何运用DataWorks数据同步功能，将Hadoop数据同步到阿里云Elasticsearch上

如何通过DataWorks数据同步功能，将Hadoop数据同步到阿里云Elasticsearch上，并进行搜索分析。

7322 0 2

来自：检索分析服务 Elasticsearch版版块

金竹

|

关系型数据库 Java Apache

|

博文

Apache Flink 漫谈系列(09) - JOIN 算子

聊什么在《Apache Flink 漫谈系列 - SQL概览》中我们介绍了JOIN算子的语义和基本的使用方式，介绍过程中大家发现Apache Flink在语法语义上是遵循ANSI-SQL标准的，那么再深思一下传统数据库为啥需要有JOIN算子呢？在实现原理上面Apache Flink内部实现和传统.

12572 0 5

来自：实时计算 Flink 版块

晋恒

|

分布式计算 MaxCompute SQL

|

博文

阿里云MaxCompute 2019-10 月刊

MaxCompute支持分区合并，支持VPC网络IP白名单设置，支持自然连接NATURAL JOIN等新功能尽在10月刊。

5218 0 0

来自：大数据计算 MaxCompute 版块

云无谓

|

Web App开发 SQL 大数据

|

博文

阿里云AnalyticDB数据导出到E-MapReduce实践

阿里云的分析型数据库（AnalyticDB）和E-MapReduce（简称EMR）在大数据场景下非常有用，本文将介绍如何尝试打通两个产品，将通过EMR中自带的开源工具Sqoop来完成这个任务。

4538 0 0

来自：开源大数据平台 E-MapReduce 版块

隐林

|

分布式计算测试技术数据库

|

博文

MaxCompute原（ODPS）创建dual表

5265 0 0

来自：大数据计算 MaxCompute 版块

隐林

|

资源调度固态存储大数据

|

博文

【大数据技术干货】阿里云伏羲(fuxi)调度器FuxiMaster功能简介(四) NodeLabel调度

转载自xingbao各位好，这是介绍阿里云伏羲(fuxi)调度器系列文章的第四篇，今天主要介绍NoedLabel的调度策略一、FuxiMaster简介 FuxiMaster和Yarn非常相似，定位于分布式系统中资源管理与分配的角色：一个典型的资源分配流程图如下所示：作为调度器，目前FuxiM

5254 0 0

来自：大数据计算 MaxCompute 版块

隐林

|

人工智能分布式计算大数据

|

博文

【广州云栖大数据/人工智能会场信息】全新一代人工智能引擎MaxCompute惊艳全场

11月22日在广州举办的2017年云栖大会·广东分会今天拉开序幕，小编已经深深感受到了华南地区小伙伴们的热情，针对大家好奇的问题，如本届广东分会阿里云会有什么亮点？邀请了哪些嘉宾？展台会有什么活动等等问题，小编在这里为大家做个现场报道吧！

4514 0 0

来自：大数据计算 MaxCompute 版块

隐林

|

SQL 分布式计算 MaxCompute

|

博文

MaxCompute 中的Code Generation技术简介

前言在《数据库系统中的Code Generation技术介绍》中，我们简单介绍了一下Code Generation技术及其在大规模OLAP系统，特别是大规模分布式OLAP系统中的重要性。MaxCompute采用了Code Generation技术来提高计算效率。在MaxCompute

4634 0 0

来自：大数据计算 MaxCompute 版块

开源大数据EMR

|

机器学习/深度学习存储分布式计算

|

博文

Apache Spark3.0什么样？一文读懂Apache Spark最新技术发展与展望

阿里巴巴高级技术专家李呈祥带来了《Apache Spark 最新技术发展和3.0+ 展望》的全面解析，为大家介绍了Spark在整体IT基础设施上云背景下的新挑战和最新技术进展，同时预测了Spark 3.0即将重磅发布的新功能。

5282 0 0

来自：开源大数据平台 E-MapReduce 版块

晋恒

|

存储分布式计算大数据

|

博文

80后阿里P10，“关老板”如何带着MaxCompute一路升级？

我是个幸运的人。虽然幸运不能被复制，但是眼光和努力可以。 “我是一个兴趣驱动型的人，职业生涯总的来说，还算挺幸运的，做自己感兴趣的事情，走上IT这一行……” 特别久以前，大概初中的时候有了自己的第一台电脑，大名鼎鼎的486，带一个数学协处理器，主频266MHz，内存有4MB。”

5644 0 1

来自：大数据计算 MaxCompute 版块

YuuuZeee

|

SQL 弹性计算分布式计算

|

博文

5块钱低成本阿里云大数据生态协同过滤推荐系统实战

前情提要人工智能千千万，没法落地都白干。自从上次老司机用神经网络训练了热狗识别模型以后，群众们表示想看一波更加接地气，最好是那种能10分钟上手，一辈子受用的模型。这次，我们就通过某著名电商公司的公开数据集，在阿里云大数据生态之下快速构建一个基于协同过滤的推荐系统！推荐系统大家都不陌生，早就已经和大家的生活息息相关。

5541 0 0

来自：人工智能平台PAI 版块

继盛

|

Python

|

博文

Mars 是什么、能做什么、如何做的——记 Mars 在 PyCon China 2018 上的分享

最近，在 PyCon China 2018 的北京主会场、成都和杭州分会场都分享了我们最新的工作 Mars，基于矩阵的统一计算框架。本文会以文字的形式对 PyCon 中国上的分享再进行一次阐述。听到 Mars，很多第一次听说的同学都会灵魂三问：Mars 是什么，能做什么，怎么做的。

5514 0 0

来自：大数据计算 MaxCompute 版块

刘士琛席奈

|

机器学习/深度学习算法搜索推荐

|

博文

认知你的用户——Representation Factory for E-commerce Search

4582 0 0

来自：智能搜索推荐版块

祎休

|

分布式计算监控 DataWorks

|

博文

通过DataWorks数据集成归档日志服务数据至MaxCompute进行离线分析

通过DataWorks归档日志服务数据至MaxCompute

4338 0 1

来自：大数据计算 MaxCompute 版块

巫宸

|

算法 Java 应用服务中间件

|

博文

TPP稳定性之场景隔离和多租户

6734 0 1

来自：智能搜索推荐版块

最新

最热

免费试用

博文

问答

电子书

视频

学习

体验

活动

【玩转数据系列十】利用阿里云机器学习在深度学习框架下实现智能图片分类

数据仓库介绍与实时数仓案例

分布式快照算法: Chandy-Lamport

MaxCompute执行作业慢的原因排查

阿里云MaxCompute（大数据）公开数据集---带你玩转人工智能

【玩转数据系列十五】机器学习PAI为你自动写歌词，妈妈再也不用担心我的freestyle了（提供数据、代码）

[大数据新手上路]“零基础”系列课程--如何将ECS上的Hadoop数据迁移到阿里云数加·MaxCompute

干货：解码OneData，阿里的数仓之路。

混合云模式下 MaxCompute + Hadoop 混搭大数据架构实践

【玩转数据系列一】人口普查统计案例

JindoFS解析 - 云上大数据高性能数据湖存储方案

【玩转数据系列十三】机器学习算法基于信用卡消费记录做信用评分

阿里云大数据计算平台的自动化、精细化运维之路

重磅首发 |《Elasticsearch 中国开发者调查报告》探索开发者的现状和未来

开源大数据周刊-第90期

阿里大航杯AI电力大赛比赛分享及数加平台，机器学习pai使用经验

细数阿里云服务器的十二种典型应用场景

【X-Pack解读】阿里云Elasticsearch X-Pack 安全组件功能详解

SQL优化器原理 - Auto Hash Join

Mars——基于张量的统一分布式计算框架

【X-Pack解读】阿里云Elasticsearch X-Pack 监控组件功能详解

Flink SQL 功能解密系列 —— 数据去重的技巧和思考

阿里巴巴大数据实践之数据建模

开源大数据周刊-第66期

istio网络转发分析

Apache Flink 漫谈系列(15) - DataStream Connectors之Kafka

从未停止进化的MaxCompute

MaxCompute（原ODPS）开发入门指南——计量计费篇

从MapReduce的执行来看如何优化MaxCompute（原ODPS） SQL

阿里云MaxCompute 2019-4月刊

PyODPS DataFrame：统一的数据查询语言

阿里云机器学习平台PAI，助力降低机器学习的成本和技术门槛

BasicEngine — 基于DII平台的推荐召回引擎

玩转阿里云EMR三部曲-高级篇 交互式查询及统一数据源

携程实时智能检测平台建设实践

【最佳实践】如何运用DataWorks数据同步功能，将Hadoop数据同步到阿里云Elasticsearch上

Apache Flink 漫谈系列(09) - JOIN 算子

阿里云MaxCompute 2019-10 月刊

阿里云AnalyticDB数据导出到E-MapReduce实践

MaxCompute原（ODPS）创建dual表

【大数据技术干货】阿里云伏羲(fuxi)调度器FuxiMaster功能简介(四) NodeLabel调度

【广州云栖大数据/人工智能会场信息】全新一代人工智能引擎MaxCompute惊艳全场

MaxCompute 中的Code Generation技术简介

Apache Spark3.0什么样？一文读懂Apache Spark最新技术发展与展望

80后阿里P10，“关老板”如何带着MaxCompute一路升级？

5块钱低成本阿里云大数据生态协同过滤推荐系统实战

Mars 是什么、能做什么、如何做的——记 Mars 在 PyCon China 2018 上的分享

认知你的用户——Representation Factory for E-commerce Search

通过DataWorks数据集成归档日志服务数据至MaxCompute进行离线分析

TPP稳定性之场景隔离和多租户

大数据与机器学习

活跃用户

相关产品

玩转阿里云EMR三部曲-高级篇交互式查询及统一数据源