大数据与机器学习-博文-阿里云开发者社区

巢甜

|

数据可视化开发者

|

博文

身怀绝技的开发者们，快来DataV玩转可视化组件

DataV开发者版启动公测啦。

47212 3 17

来自：数据可视化DataV 版块

封神

|

分布式计算 Hadoop 分布式数据库

|

博文

阿里封神谈hadoop生态学习之路

在大数据时代，要想个性化实现业务的需求，还是得操纵各类的大数据软件，如：hadoop、hive、spark等。笔者（阿里封神）混迹Hadoop圈子多年，经历了云梯1、ODPS等项目，目前base在E-Mapreduce。在这，笔者尽可能梳理下hadoop的学习之路。

51257 14 53

来自：开源大数据平台 E-MapReduce 版块

傲海

|

机器学习/深度学习算法对象存储

|

博文

【玩转数据系列十】利用阿里云机器学习在深度学习框架下实现智能图片分类

伴随着今日阿里云机器学习PAI在云栖大会的重磅发布，快来感受下人工智能的魅力。一、背景随着互联网的发展，产生了大量的图片以及语音数据，如何对这部分非结构化数据行之有效的利用起来，一直是困扰数据挖掘工程师的一到难题。

51158 71 143

来自：人工智能平台PAI 版块

李寻弥-27988

|

供应链数据可视化前端开发

|

博文

你刚吃的兰州牛肉面，背后就藏着大数据

兰州拉面都拥抱大数据了，此刻我只想问，黄焖鸡、麻辣烫和沙县小吃，你们还在等什么？

44386 58 72

来自：数据可视化DataV 版块

隐林

|

存储分布式计算监控

|

博文

大数据环境下该如何优雅地设计数据分层

发个牢骚，搞大数据的也得建设数据仓库吧。而且不管是传统行业还是现在的互联网公司，都需要对数据仓库有一定的重视，而不是谈一句自己是搞大数据的就很厉害了。数据仓库更多代表的是一种对数据的管理和使用的方式，它是一整套包括了etl、调度、建模在内的完整的理论体系。

41426 9 10

来自：大数据计算 MaxCompute 版块

隐林

|

SQL 算法安全

|

博文

ODPS（Open Data Processing Service），原是阿里云从 09年开始自研的大规模批量计算引擎，2016 年更名为MaxCompute。2022云栖大会上，阿里云ODPS全新升级为一体化大数据平台，存储、调度、元数据一体化融合，从 Processing 升级为 Platform，即 Open Data Platform and Service。提供了离线计算、实时交互式分析、机器学习等可扩展的智能计算引擎，满足用户多元化数据计算需求。

79355 133 139

来自：大数据计算 MaxCompute 版块

工程师甲

|

弹性计算关系型数据库 MySQL

|

博文

【技术实验】mysql准实时同步数据到Elasticsearch

Elasticsearch作为大数据场景下搜索和分析的引擎，广泛应用于实时数据分析等场景。本文作者梳理了从MySQL准实时同步数据到Elasticsearch的实操步骤，帮助开发者理解和快速上手。

25143 154 160

来自：检索分析服务 Elasticsearch版版块

付空

|

消息中间件存储供应链

|

博文

数据仓库介绍与实时数仓案例

1.数据仓库简介数据仓库是一个面向主题的（Subject Oriented）、集成的（Integrate）、相对稳定的（Non-Volatile）、反映历史变化（Time Variant）的数据集合，用于支持管理决策。

45887 238 254

来自：实时计算 Flink 版块

尼不要逗了

|

分布式计算算法大数据

|

博文

分布式快照算法: Chandy-Lamport

Spark 的 Structured Streaming 的 Continuous Processing Mode 的容错处理使用了分布式快照（Distributed Snapshot）算法 Chandy-Lamport 算法，那么分布式快照算法可以用来解决什么问题呢？

26766 71 72

来自：开源大数据平台 E-MapReduce 版块

隐林

|

分布式计算 MaxCompute

|

博文

MaxCompute执行作业慢的原因排查

大家在平时开发过程中经常遇到作业（SQL、MR等）执行慢的原因，今天带大家一起学习自排查方法。 1、wait wait ，job querying 遇到这个提示，就是资源出现了排队，如果你是后付费用户，那就是整个后付费的共享池已经没有富余的资源了，要等前一个作业处理完。

27835 5 7

来自：大数据计算 MaxCompute 版块

晋恒

|

分布式计算 MaxCompute 存储

|

博文

吴刚专访--大数据和 MaxCompute 技术和故事

2019大数据技术公开课第一季《技术人生专访》来袭，本季将带领开发者们探讨大数据技术，分享不同国家的工作体验。本文整理自阿里巴巴计算平台事业部高级技术专家吴刚的专访，将为大家介绍Apache ORC开源项目、主流的开源列存格式ORC和Parquet的区别以及MaxCompute选择ORC的原因。

20539 4 4

来自：大数据计算 MaxCompute 版块

yunqi_share

|

云栖大会

|

博文

2017杭州云栖大会FAQ（持续更新中）

2017杭州云栖大会将于10月11-14日在杭州云栖小镇举办，作为全球最具影响力的科技展会之一，今年的云栖大会规模更大，内容也更丰富。为了帮助大家解决报名、参会中的一些问题，小编专门整理了下大会相关的FAQ，供大家参考。

19644 129 164

来自：大数据计算 MaxCompute 版块

傲海

|

机器学习/深度学习 TensorFlow 算法框架/工具

|

博文

【玩转数据系列十五】机器学习PAI为你自动写歌词，妈妈再也不用担心我的freestyle了（提供数据、代码）

背景最近互联网上出现一个热词就是“freestyle”，源于一个比拼rap的综艺节目。在节目中需要大量考验选手的freestyle能力，freestyle指的是rapper即兴的根据一段主题讲一串rap。

21429 5 18

来自：人工智能平台PAI 版块

阿里云实时计算Flink

|

人工智能算法框架/工具流计算

|

博文

独家专访阿里集团副总裁贾扬清：我为什么选择加入阿里巴巴？

在这次访谈中，贾扬清向我们透露了他加入阿里的原因，并对他目前在阿里主要负责的工作做了详细说明，他不仅回顾了过去 6 年 AI 框架领域发生的变化，也分享了自己对于 AI 领域现状的观察和对未来发展的思考。结合自己的经验，贾扬清也给出了一些针对 AI 方向选择和个人职业发展的建议，对于 AI 从业者来

18478 2 10

来自：实时计算 Flink 版块

傲海

|

机器学习/深度学习自然语言处理算法

|

博文

【玩转数据系列六】文本分析算法实现新闻自动分类

新闻分类是文本挖掘领域较为常见的场景。目前很多媒体或是内容生产商对于新闻这种文本的分类常常采用人肉打标的方式，消耗了大量的人力资源。本文尝试通过智能的文本挖掘算法对于新闻文本进行分类。无需任何人肉打标，完全由机器智能化实现。

20267 1 3

来自：人工智能平台PAI 版块

阿里云实时计算Flink

|

SQL API 双11

|

博文

实时计算 Flink SQL 核心功能解密

Flink SQL 是于2017年7月开始面向集团开放流计算服务的。虽然是一个非常年轻的产品，但是到双11期间已经支撑了数千个作业，在双11期间，Blink 作业的处理峰值达到了5+亿每秒，而其中仅 Flink SQL 作业的处理总峰值就达到了3亿/秒。

20319 1 3

来自：实时计算 Flink 版块

隐林

|

分布式计算 MaxCompute BI

|

博文

【转载】时隔一年多，我又用起了 Superset

去年 6 月份在流利说提离职后，leader 问我为什么要走。我说，流利说有很健全的数据处理基础设施，但这不是所有的公司都会有的条件，所以我想看看在一个基建不全的创业公司我是否也可以像现在一样做的好。

18432 82 83

来自：大数据计算 MaxCompute 版块

隐林

|

存储分布式计算搜索推荐

|

博文

干货：解码OneData，阿里的数仓之路。

据IDC报告，预计到2020年全球数据总量将超过40ZB(相当于4万亿GB)，这一数据量是2013年的10倍。正在“爆炸式”增长的数据的潜在巨大价值正在被发掘，它有可能成为商业世界的“新能源”，变革我们的生产，影响我们生活。当我们面对如此庞大的数据之时，如果我们不能有序、有结构的进行分类组织

22476 2 4

来自：大数据计算 MaxCompute 版块

隐林

|

弹性计算分布式计算 Hadoop

|

博文

[大数据新手上路]“零基础”系列课程--如何将ECS上的Hadoop数据迁移到阿里云数加·MaxCompute

想用阿里云数加·大数据计算服务（MaxCompute），但是现在数据还在hadoop上，怎么办？别烦恼，跟着我们走，来一次MaxCompute零基础数据迁移之旅～Let’s Go！

18246 0 0

来自：大数据计算 MaxCompute 版块

晋恒

|

存储分布式计算大数据

|

博文

阿里云MaxCompute 2019-5月刊

5月MaxCompute新功能发布，精彩技术好文推荐，技术干货下载，6月重要活动抢先知道，尽在5月刊。

15624 0 0

来自：大数据计算 MaxCompute 版块

隐林

|

存储 SQL 运维

|

博文

流计算StreamCompute

背景每年的双十一除了“折扣”，全世界（特别是阿里人）都关注的另一个焦点是面向媒体直播的“实时大屏”（如下图所示）。包括总成交量在内的各项指标，通过数字维度展现了双十一狂欢节这一是买家，卖家及物流小二一起创造的奇迹！双十一媒体直播大屏这一大屏背后需要实时处理海量的庞大电商系统各个模块产生的

19533 76 77

来自：实时计算 Flink 版块

尼不要逗了

|

分布式计算大数据 Apache

|

博文

现代流式计算的基石：Google DataFlow

0. 引言今天这篇继续讲流式计算。毫无疑问，Apache Flink 和 Apache Spark （Structured Streaming）现在是实时流计算领域的两个最火热的话题了。那么为什么要介绍 Google Dataflow 呢？Streaming Systems 这本书在分析 Fli...

19750 60 60

来自：开源大数据平台 E-MapReduce 版块

冶善

|

分布式计算关系型数据库大数据

|

博文

［ETL实践指南］基于Kettle的MaxCompute插件实现数据上云

本文用到的阿里云数加－大数据计算服务MaxCompute产品地址：https://www.aliyun.com/product/odps 简介 Kettle是一款开源的ETL工具，纯java实现，可以运行于Windows, Unix, Linux上运行，提供图形化的操作界面，可以通过拖拽控件的方式，方便地定义数据传输的拓扑。

21434 3 21

来自：大数据计算 MaxCompute 版块

隐林

|

数据采集分布式计算监控

|

博文

阿里数据仓库实践分享

数据仓库，是为企业所有级别的决策制定过程，提供所有类型数据支持的战略集合。它是单个数据存储，出于分析性报告和决策支持目的而创建。为需要业务智能的企业，提供指导业务流程改进、监视时间、成本、质量以及控制。

16336 1 1

来自：大数据计算 MaxCompute 版块

jaredguo

|

搜索推荐 API 开发者

|

博文

OpenSearch：轻松构建大数据搜索服务

随着互联网数据规模的爆炸式增长，如何从海量的历史、实时数据中快速获取有用信息，变得越来越具有挑战性。搜索是获取信息最高效的途径之一，因此也是各类网站、应用的基础标配功能。开发者想在自己的产品中实现搜索功能一般都是基于某个开源搜索系统(如ElasticSearch、Solr、Sphinx

17910 3 5

来自：智能搜索推荐版块

鱼跟猫

|

消息中间件关系型数据库 Kafka

|

博文

如何使用Kafka Connect实现同步RDS binlog数据

本文介绍如何在E-MapReduce上使用Kafka Connect实现同步RDS binlog数据

16785 1 3

来自：开源大数据平台 E-MapReduce 版块

隐林

|

算法搜索推荐大数据

|

博文

品《阿里巴巴大数据实践-大数据之路》一书(下)

今天继续谈阿里的这本书，包括数据服务平台、数据挖掘平台、数据建模、数据管理及数据应用，希望于你有启示。 1、数据服务平台数据服务平台可以叫数据开放平台，数据部门产出海量数据，如何能方便高效地开放出去，是我们一直要解决的难题，在没有数据服务的年代，阿里的数据开放的方式简单、粗暴，一般是直接将数据导出给对方，我想，现在大多公司的开放应该也是如此吧，虽然PaaS喊了这么多年，但真正成就的又有几个？即使如阿里，在数据开放这个方向上的探索和实践，至今也有7个年头了，任何关于数据开放毕其功于一役的做法都将失败，任何一次数据开放的改进都是伴随着对于业务理解的深入而成长起来的。

16365 2 3

来自：大数据计算 MaxCompute 版块

开源大数据EMR

|

对象存储存储分布式计算

|

博文

JindoFS: 云上大数据的高性能数据湖存储方案

JindoFS 是EMR打造的高性能大数据存储服务，可以为不同的计算引擎提供不同的存储服务，可以根据应用的场景来选择不同的存储模式。在2019杭州云栖大会大数据生态专场，阿里巴巴计算平台事业部EMR团队技术专家殳鑫鑫和Intel大数据团队软件开发经理徐铖共同向大家分享了云上大数据的高性能数据湖存储方案JindoFS的产生背景、架构以及与Intel DCPM的性能评测。

17421 58 58

来自：开源大数据平台 E-MapReduce 版块

晋恒

|

机器学习/深度学习分布式计算大数据

|

博文

互联网下半场的角逐，玩转轻资产的大数据服务 | 阿里云栖开发者沙龙大数据专场（北京站）干货集锦

MaxCompute（原ODPS）是一项大数据计算服务，它能提供快速、完全托管的PB级数据仓库解决方案，使您可以经济并高效的分析处理海量数据。欢迎加入钉钉交流群11782920。

13926 0 0

来自：大数据计算 MaxCompute 版块

隐林

|

机器学习/深度学习算法大数据

|

博文

阿里云机器学习平台的思考

最近读了阿里的《大数据之路-阿里巴巴大数据实践》，对于其机器学习平台也蛮感兴趣，正好阿里出了本新书《解析阿里云机器学习平台》，顺便读了下，感触也不少，结合最近团队机器学习的一些思考，特别在此分享于你。

13531 0 2

来自：大数据计算 MaxCompute 版块

曾xiaoyi

|

算法搜索推荐前端开发

|

博文

搜索双链路实时计算体系@双11实战

该文章来自阿里巴巴技术协会（ATA）精选集 0. 前言何为双链路实时计算体系？微观实时计算链路 a) 最细粒度商品/店铺/用户数据的实时 b) 底层模型的实时宏观实时计算链路相比微观实时，宏观实时的对象粒度更粗，更上层 a) 以实时效果为目标，基于bandit learning的实

16564 2 3

来自：智能搜索推荐版块

傲海

|

机器学习/深度学习 SQL 分布式计算

|

博文

【玩转数据系列一】人口普查统计案例

玩转数据系列文章通过简单地案例搭建，介绍如何通过阿里云机器学习平台进行数据挖掘。

17816 3 3

来自：人工智能平台PAI 版块

晋恒

|

大数据

|

博文

【内含分享PPT/视频/文章】阿里云MVP学院MaxCompute技术闭门会线上首播 | 2019大数据技术公开课第二季

数据的价值是解释业务还是预测业务？是支撑业务还是驱动业务？企业级计算服务的核心问题是什么？企业级计算平台要解决的核心问题是什么？商业和技术的平衡点在哪里？一起直播学习，让数据真正驱动业务。

13972 2 4

来自：大数据计算 MaxCompute 版块

付空

|

运维流计算

|

博文

阿里云实时计算产品案例&解决方案汇总

阿里云实时计算产品案例&解决方案汇总页

29578 3 6

来自：实时计算 Flink 版块

曾安祥仁重

|

机器学习/深度学习分布式计算算法

|

博文

凑单算法——基于Graph Embedding的bundle mining

本文描述如何在凑单场景突破找相似、发现惊喜的同时做到成交翻倍，实现体验和数据上的双赢。

16752 2 8

来自：智能搜索推荐版块

开源大数据EMR

|

对象存储存储分布式计算

|

博文

JindoFS解析 - 云上大数据高性能数据湖存储方案

JindoFS 是云原生的文件系统，可以提供OSS 超大容量以及本地磁盘的性能

16550 0 1

来自：开源大数据平台 E-MapReduce 版块

隐林

|

分布式计算大数据 MaxCompute

|

博文

阿里云数加MaxCompute购买咨询钉钉群

为企业解答阿里云MaxCompute大数据计算产品购买问题。

14729 0 2

来自：大数据计算 MaxCompute 版块

隐林

|

数据采集分布式计算大数据

|

博文

企业大数据平台下数仓建设思路

介然（李金波），阿里云高级技术专家，现任阿里云大数据数仓解决方案总架构师。8年以上互联网数据仓库经历，对系统架构、数据架构拥有丰富的实战经验，曾经数据魔方、淘宝指数的数据架构设计专家。与阿里云大数据数仓结缘介然之前在一家软件公司给企业客户做软件开发和数仓开发实施，数仓开发和实施都是基于传统的

14820 1 1

来自：大数据计算 MaxCompute 版块

祎休

|

SQL 分布式计算搜索推荐

|

博文

大数据workshop：《云数据·大计算：海量日志数据分析与应用》之《数据加工：用户画像》篇

本手册为阿里云MVP《云计算·大数据：海量日志数据分析与应用》的《数据加工：用户画像》篇而准备。主要阐述在使用大数据开发套件过程中如何将已经采集至MaxCompute上的日志数据进行加工并进行用户画像，学员可以根据本实验手册，去学习如何创建SQL任务、如何处理原始日志数据。

13825 0 2

来自：大数据计算 MaxCompute 版块

阿里云实时计算Flink

|

分布式计算数据处理 API

|

博文

流计算精品翻译: The Dataflow Model

我们提出了Dataflow模型，并详细地阐述了它的语义，设计的核心原则，以及在实践开发过程中对模型的检验。

20467 1 2

来自：实时计算 Flink 版块

隐林

|

SQL 分布式计算算法

|

博文

MaxCompute SQL原理解析及性能调优

分享内容介绍了ODPS SQL的基于mapreduce是如何实现的及一些使用小技巧，回顾了mapreduce各个阶段可能产生的问题及相应的处理方法，同时介绍了一些应对数据倾斜的处理方法，最后介绍了一些关于数据集构造、特征选择的技巧帮助减少资源利用。

12848 0 0

来自：大数据计算 MaxCompute 版块

祎休

|

分布式计算 DataWorks 安全

|

博文

MaxCompute/DataWorks权限问题排查建议

MaxCompute/DataWorks权限问题排查建议 __前提：__MaxCompute与DataWorks为两个产品，在权限体系上既有交集又要一定的差别。在权限问题之前需了解两个产品独特的权限体系。

12792 0 1

来自：大数据计算 MaxCompute 版块

梅熙

|

SQL 分布式计算网络安全

|

博文

如何在Aliyun E-MapReduce集群上使用Zeppelin和Hue

目前Aliyun E-MapReduce支持了zeppelin和hue，在Aliyun E-MapReduce集群上可以很方便的使用zeppelin和hue。本文将详细介绍如何在Aliyun E-MapReduce玩转Zeppelin和Hue！

14339 23 27

来自：开源大数据平台 E-MapReduce 版块

阿里云实时计算Flink

|

流计算 Apache

|

博文

接着！！Apache Flink 全领域干货合集（持续更新）

Apache Flink 下一代开源大数据计算引擎，可对有限数据流和无限数据流进行有状态计算，可部署在各种集群环境，对各种大小的数据规模进行快速计算。Flink 1.9.0 发布，在批流融合与功能特性上有重大更新，本专题将持续更新新增特性的具体说明及全领域干货。

17170 0 2

来自：实时计算 Flink 版块

阿里云实时计算Flink

|

流计算 Apache 人工智能

|

博文

回顾 | Kafka x Flink Meetup 与世界人工智能大会大数据 AI 专场精彩回顾（附PPT下载）

8 月最后一天，由 Apache Kafka 与 Apache Flink 联合举办的 Meetup 深圳站圆满落幕，现场站无虚席，来自 Confluent 、中国农业银行、虎牙直播、数见科技以及阿里巴巴的五位技术专家带来了丰富精彩的分享，全场干货满满！

14732 0 0

来自：实时计算 Flink 版块

傲海

|

机器学习/深度学习算法搜索推荐

|

博文

【玩转数据系列十三】机器学习算法基于信用卡消费记录做信用评分

机器学习算法基于信用卡消费记录做信用评分背景如果你是做互联网金融的，那么一定听说过评分卡。评分卡是信用风险评估领域常用的建模方法，评分卡并不简单对应于某一种机器学习算法，而是一种通用的建模框架，将原始数据通过分箱后进行特征工程变换，继而应用于线性模型进行建模的一种方法。

15785 1 3

来自：人工智能平台PAI 版块

清淞

|

机器学习/深度学习自然语言处理算法

|

博文

阿士比亚：搜索团队智能内容生成实践

本文主要介绍阿里巴巴-搜索事业部算法团队上半年在智能内容生成方向工作的一些实践和思考。

17030 2 5

来自：智能搜索推荐版块

阿里云实时计算Flink

|

SQL 流计算

|

博文

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

TopN 是统计报表和大屏非常常见的功能，主要用来实时计算排行榜。流式的 TopN 不同于批处理的 TopN，它的特点是持续的在内存中按照某个统计指标（如出现次数）计算 TopN 排行榜，然后当排行榜发生变化时，发出更新后的排行榜。

18999 1 7

来自：实时计算 Flink 版块

傲海

|

机器学习/深度学习算法对象存储

|

博文

机器学习PAI全新功效——实时新闻热点Online Learning实践

(本实验会用到流式机器学习算法，正处于邀测状态，需要申请开通)PAI地址：https://data.aliyun.com/product/learn流式机器学习算法申请：https://data.aliyun.com/paionlinelearning打开新闻客户端，往往会收到热点新闻推送相关的内容。

15533 0 0

来自：人工智能平台PAI 版块

桑弦

|

人工智能分布式计算大数据

|

博文

倒计时1天！相约杭州云栖，相遇数据智能

2016杭州云栖大会盛大开启，与阿里云大数据一起相约杭州云栖，相遇数据智能！我们精心准备了四大智能看点，等你用一颗大数据的心，鞠一捧智能的“水”。

11549 1 6

来自：大数据计算 MaxCompute 版块

最新

最热

免费试用

博文

问答

电子书

视频

学习

体验

活动

身怀绝技的开发者们，快来DataV玩转可视化组件

阿里封神谈hadoop生态学习之路

【玩转数据系列十】利用阿里云机器学习在深度学习框架下实现智能图片分类

你刚吃的兰州牛肉面，背后就藏着大数据

大数据环境下该如何优雅地设计数据分层

odps是什么?

【技术实验】mysql准实时同步数据到Elasticsearch

数据仓库介绍与实时数仓案例

分布式快照算法: Chandy-Lamport

MaxCompute执行作业慢的原因排查

吴刚专访--大数据和 MaxCompute 技术和故事

2017杭州云栖大会FAQ（持续更新中）

【玩转数据系列十五】机器学习PAI为你自动写歌词，妈妈再也不用担心我的freestyle了（提供数据、代码）

独家专访阿里集团副总裁贾扬清：我为什么选择加入阿里巴巴？

【玩转数据系列六】文本分析算法实现新闻自动分类

实时计算 Flink SQL 核心功能解密

【转载】时隔一年多，我又用起了 Superset

干货：解码OneData，阿里的数仓之路。

[大数据新手上路]“零基础”系列课程--如何将ECS上的Hadoop数据迁移到阿里云数加·MaxCompute

阿里云MaxCompute 2019-5月刊

流计算StreamCompute

现代流式计算的基石：Google DataFlow

［ETL实践指南］基于Kettle的MaxCompute插件实现数据上云

阿里数据仓库实践分享

OpenSearch：轻松构建大数据搜索服务

如何使用Kafka Connect实现同步RDS binlog数据

品《阿里巴巴大数据实践-大数据之路》一书(下)

JindoFS: 云上大数据的高性能数据湖存储方案

互联网下半场的角逐，玩转轻资产的大数据服务 | 阿里云栖开发者沙龙大数据专场（北京站）干货集锦

阿里云机器学习平台的思考

搜索双链路实时计算体系@双11实战

【玩转数据系列一】人口普查统计案例

【内含分享PPT/视频/文章】阿里云MVP学院MaxCompute技术闭门会线上首播 | 2019大数据技术公开课第二季

阿里云实时计算产品案例&解决方案汇总

凑单算法——基于Graph Embedding的bundle mining

JindoFS解析 - 云上大数据高性能数据湖存储方案

阿里云数加MaxCompute购买咨询钉钉群

企业大数据平台下数仓建设思路

大数据workshop：《云数据·大计算：海量日志数据分析与应用》之《数据加工：用户画像》篇

流计算精品翻译: The Dataflow Model

MaxCompute SQL原理解析及性能调优

MaxCompute/DataWorks权限问题排查建议

如何在Aliyun E-MapReduce集群上使用Zeppelin和Hue

接着！！Apache Flink 全领域干货合集（持续更新）

回顾 | Kafka x Flink Meetup 与世界人工智能大会大数据 AI 专场精彩回顾（附PPT下载）

【玩转数据系列十三】机器学习算法基于信用卡消费记录做信用评分

阿士比亚：搜索团队智能内容生成实践

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

机器学习PAI全新功效——实时新闻热点Online Learning实践

倒计时1天！相约杭州云栖，相遇数据智能

大数据与机器学习

活跃用户

相关产品