大数据与机器学习-博文-第5页-阿里云开发者社区

工程师甲

|

分布式计算 Hadoop DataWorks

|

博文

【最佳实践】如何运用DataWorks数据同步功能，将Hadoop数据同步到阿里云Elasticsearch上

如何通过DataWorks数据同步功能，将Hadoop数据同步到阿里云Elasticsearch上，并进行搜索分析。

7559 0 2

来自：检索分析服务 Elasticsearch版版块

隐林

|

机器学习/深度学习分布式计算数据可视化

|

博文

阿里云数加（大数据）打造雄安智慧新区

自从4月1日，中共中央、国务院印发通知，决定设立河北雄安新区之后，这个无名小城就一夜爆红。雄安新区规划范围涉及河北省雄县、容城、安新3县及周边部分区域，地处北京、天津、保定腹地，是继深圳经济特区和上海浦东新区之后又一具有全国意义的新区。

5379 0 0

来自：大数据计算 MaxCompute 版块

付空

|

流计算供应链 SQL

|

博文

【阿里内部应用】利用blink CEP实现流计算中的超时统计问题

案例与解决方案汇总页：阿里云实时计算产品案例&解决方案汇总一. 背景介绍如<利用blink+MQ实现流计算中的延时统计问题>一文中所描述的场景，我们将其简化为以下案例：实时流的数据源结构如下：物流订单号支付时间仓接单时间仓出库时间 LP1 2018-08-01 08:00 ...

5402 1 1

来自：实时计算 Flink 版块

工程师甲

|

运维监控安全

|

博文

【ELK入门】Elastic中文社区运维监控实战之架构篇

阿里云MVP曾勇撰写的《ELK运维监控入门实战》系列，以Elasticsearch中文社区网站运维监控体系搭建作为案例，讲解了ELK监控系统的相关原理和技术实现，可作为对ELK感兴趣的同学的入门级文章。本篇作为第一篇，介绍了项目背景和技术架构。

7448 0 3

来自：检索分析服务 Elasticsearch版版块

开源大数据EMR

|

机器学习/深度学习 Web App开发安全

|

博文

开源大数据周刊-第54期

5006 0 0

来自：开源大数据平台 E-MapReduce 版块

隐林

|

SQL 分布式计算大数据

|

博文

MaxCompute 2.0 NewSQL演进之路

10月14日，2017杭州云栖大会·阿里云大数据计算服务（MaxCompute）专场，阿里巴巴计算平台架构师林伟分享了主题《MaxCompute2.0的NewSQL演进之路》，介绍阿里云大数据计算服务MaxCompute 2.0在NewSQL上所做的优化和实践工作。

5282 0 0

来自：大数据计算 MaxCompute 版块

百遇

|

机器学习/深度学习分布式计算搜索推荐

|

博文

技术创业难？看汇合营销如何玩转大数据与机器学习

峰值期间，汇合营销每天需要收集、分析和存储20多亿条的访客浏览轨迹；同时，还需要根据用户需求在亿级日志表中做秒级查询。

5377 0 0

来自：大数据计算 MaxCompute 版块

阿里云实时计算Flink

|

SQL 大数据流计算

|

博文

Flink SQL 功能解密系列 —— 解决热点问题的大杀器MiniBatch

在Blink的流式任务中，State相关的操作通常都会成为整个任务的性能瓶颈。实时计算部-查询和优化团队开发了MiniBatch功能，大幅降低了State操作的开销，在今年的双11中，几乎所有适用的任务都启用了MiniBatch功能。

6792 0 2

来自：实时计算 Flink 版块

米尔。。。

|

博文

CSV 文档格式

csv 中的第一行表示字段名，第二行表示字段值比如你要实现下列静态数据： [ { "x": "1月", "y": 2, "s": "蒸发量" }, { "x": "1月", "y": 2.

6932 0 1

来自：数据可视化DataV 版块

付空

|

流计算 NoSQL Redis

|

博文

基于Flink和规则引擎的实时风控解决方案

对一个互联网产品来说，典型的风控场景包括：注册风控、登陆风控、交易风控、活动风控等，而风控的最佳效果是防患于未然，所以事前事中和事后三种实现方案中，又以事前预警和事中控制最好。这要求风控系统一定要有实时性。

14759 155 164

来自：实时计算 Flink 版块

隐林

|

分布式计算监控 BI

|

博文

基于阿里云MaxCompute实现游戏数据运营

一、总览一个游戏/系统的业务数据分析，总体可以分为图示的几个关键步骤： 1、数据采集：通过SDK埋点或者服务端的方式获取业务数据，并通过分布式日志收集系统，将各个服务器中的数据收集起来并送到指定的地方去，比如HDFS等；（注：本文Demo中，使用flume，也可选用logstash、Flue.

5020 0 0

来自：大数据计算 MaxCompute 版块

金竹

|

关系型数据库 Java Apache

|

博文

Apache Flink 漫谈系列(09) - JOIN 算子

聊什么在《Apache Flink 漫谈系列 - SQL概览》中我们介绍了JOIN算子的语义和基本的使用方式，介绍过程中大家发现Apache Flink在语法语义上是遵循ANSI-SQL标准的，那么再深思一下传统数据库为啥需要有JOIN算子呢？在实现原理上面Apache Flink内部实现和传统.

12720 0 5

来自：实时计算 Flink 版块

金竹

|

SQL 关系型数据库 MySQL

|

博文

Apache Flink 漫谈系列(06) - 流表对偶(duality)性

实际问题很多大数据计算产品，都对用户提供了SQL API，比如Hive, Spark, Flink等，那么SQL作为传统关系数据库的查询语言，是应用在批查询场景的。Hive和Spark本质上都是Batch的计算模式(在《Apache Flink 漫谈系列 - 概述》我们介绍过Spark是Micr.

10769 59 60

来自：实时计算 Flink 版块

隐林

|

存储分布式计算大数据

|

博文

MaxCompute助力OSS支持EB级计算力

一、 MaxCompute是什么你的OSS数据是否作堆积在一旁沉睡已久存储成本变为企业负担你是否想唤醒沉睡的数据驱动你的业务前行MaxCompute可以帮助你高效且低成本的解决这些问题通过对海量数据进行分析和计算来实现勾勒用户画像、提升营销转化、挖掘产品优化方向、预测业务发展等丰富的业务场景。

5033 0 0

来自：大数据计算 MaxCompute 版块

阿里云实时计算Flink

|

流计算 Java 监控

|

博文

Flink 在人工智能领域的应用实践

Flink 机器学习进度几何？如何将 Flink 与 TensorFlow 等框架相结合？有哪些 Flink 在机器学习上的生产实践应用？为你呈现 Flink 机器学习的具体应用实践与最新技术落地案例。

6530 0 0

来自：实时计算 Flink 版块

开源大数据EMR

|

分布式计算 Spark 大数据

|

博文

Apache Spark中国技术交流社区历次直播回顾（持续更新）

Apache Spark中国技术交流社区，由阿里巴巴开源大数据技术团队成立，持续输出spark相关技术直播、原创文章、精品翻译，钉钉群内千人交流学习，欢迎加入。钉钉入群 https://qr.dingtalk.com/action/joingroup?code=v1,k1,jmHATP9Tk+okK7QZ5sw2oWSNLhkt2lCRvfHRdW7XhUQ=&_dt_no_comment=1&origin=11 更多视频和ppt资料请入群获得。

8173 0 1

来自：开源大数据平台 E-MapReduce 版块

隐林

|

存储分布式计算大数据

|

博文

为什么MaxCompute采用列式存储？列式存储和行式存储的主要区别在哪

6093 0 0

来自：大数据计算 MaxCompute 版块

隐林

|

存储分布式计算搜索推荐

|

博文

一场变美盛宴后面的大数据故事

小红唇和阿里云大数据平台的牵手要从2016年5月份说起。随着小红唇业务的发展，用户量和内容量不断增加，迫切需要推出个性化功能，增加用户的使用时长和用户粘度。对于一个没有大数据/机器学习经验和技术储备，并且开发人员有限的年轻团队，在业务快速发展的情况下，如何在非常有限的开发资源和不影响正常业务开发的前提下，快速建立起自己的推荐系统，成为摆在小红唇技术团队面前一个不小的挑战。

6793 0 0

来自：大数据计算 MaxCompute 版块

隐林

|

SQL 分布式计算 OLAP

|

博文

Vectorized Execution Engine in MaxCompute 2.0简介

前言在《数据库系统中的Code Generation技术介绍》一文中，我们阐述了代码的CPU执行效率对于大规模分布式OLAP系统的重要性。现在简单总结如下： OLAP系统中查询往往比较复杂，比如多表Join, 各种聚合函数以及窗口函数，其中涉及大量的Hash计算（比如采用Hash

5007 0 0

来自：大数据计算 MaxCompute 版块

工程师甲

|

索引存储对象存储

|

博文

【最佳实践】如何从AWS中的Elasticsearch索引平滑迁移至阿里云

阿里云的易用、便捷、稳定、以及低门槛深受广大开发者欢迎，本次实践是针对希望将Elasticsearch索引迁移至阿里云的客户所准备。本次Elasticsearch索引迁移方案参考架构图如下：

6683 0 0

来自：检索分析服务 Elasticsearch版版块

祎休

|

分布式计算大数据 MaxCompute

|

博文

[使用初学者]如何快速玩转阿里云大数据计算服务MaxCompute

5443 0 1

来自：大数据计算 MaxCompute 版块

YuuuZeee

|

搜索推荐

|

博文

【数据科学老司机在线教学第二期】阿里云大数据生态协同过滤推荐系统实战

人工智能千千万，没法落地都白干。自从上次老司机用神经网络训练了热狗识别模型以后，群众们表示想看一波更加接地气，最好是那种能10分钟上手，一辈子受用的模型。这次，我们就通过某著名电商公司的公开数据集，在阿里云大数据生态之下快速构建一个基于协同过滤的推荐系统！

5742 0 0

来自：人工智能平台PAI 版块

黯灭_邓彬

|

分布式计算 Spark

|

博文

欢迎加入Spark中国社区

欢迎大家关注Spark中国社区！社区成员会定期把Spark（全球）社区的最新发布、文档等翻译后放到社区，并经常组织社区成员线上、线下的直播分享、meetup以及有奖比赛等活动，非常欢迎大家加入社区，对于发帖、提问、答疑的同学，社区会给予特色的奖励 Spark社群钉钉群

10106 1 2

来自：开源大数据平台 E-MapReduce 版块

隐林

|

Web App开发存储分布式计算

|

博文

618粉丝狂欢节来了，你的小邮局爆仓没有？

618大促马上来了，快递企业包裹量又要剧增了。数据显示，2017年全行业快件量会接近400亿件。虽然各大快递公司都事先增加了人员、设备、仓库，提升了运能，但面临的压力仍旧空前。

4803 0 0

来自：大数据计算 MaxCompute 版块

阿里云E-MapReduce团队

|

机器学习/深度学习分布式计算 Java

|

博文

浅谈 Spark 的多语言支持

Spark架构和设计上的优秀毋庸置疑，从一出道便抢了 Hadoop 的 C 位。在开源大数据的黄金十年一时风头无两，在当下人工智能时代仍然能够与时俱进，通天之处不遑多言，美中不足之处也有不少。小的方面，比如调度模型跟 MapReduce 这种计算范式过于耦合，Spark 最近引入 Barrier 调度模式就是为了支持深度学习这种新的计算类型，所幸在于对框架的改动不会伤筋动骨；有些缺陷则不然，影响全局，调整起来绝非易事。

5274 0 0

来自：开源大数据平台 E-MapReduce 版块

封神

|

弹性计算分布式计算大数据

|

博文

为什么选择ali-E-MapReduce

E-MapReduce是构建于阿里云ECS弹性虚拟机之上，利用开源大数据生态系统，包括但不限于Hadoop、Spark、Hbase，为用户提供集群、作业、数据等管理的一站式大数据处理分析服务。我们提供的软件基本都是开源的软件，会有一些性能的优化，但是绝对不引入任何不兼容的改动。

4814 0 2

来自：开源大数据平台 E-MapReduce 版块

灵培

|

机器学习/深度学习算法搜索推荐

|

博文

一天造出10亿个淘宝首页，阿里算法工程师如何实现？

双十一手淘首页个性化场景是推荐生态链路中最大的场景之一，在手淘APP承载了整体页面的流量第一入口，对用户流量的整体承接、分发、调控，以及用户兴趣的深度探索与发现上起着至关重要的作用。

5148 0 1

来自：智能搜索推荐版块

百遇

|

分布式计算大数据 API

|

博文

产品3周迭代一次，启信宝驾驭8000万企业征信的平台架构

启信宝的企业数据范围广、维度多，覆盖8000万以上的企业， 19个产业链，95个细分行业，100个以上企业数据维度，企业覆盖率达98%以上。

5356 0 0

来自：大数据计算 MaxCompute 版块

晋恒

|

关系型数据库 MySQL 数据库

|

博文

解析DataWorks数据集成中测试连通性失败问题

大家好，这里和大家分享的是DataWorks数据集成中测试连通性失败的排查思路。与测试连通性成功与否的相关因素有很多，本文按照多个因素逐步排查，最终解决问题，希望大家以后再遇到此类问题，请参考此文，相信能够顺利解决您的问题。

5161 0 0

来自：大数据计算 MaxCompute 版块

司麟嘟嘟嘟

|

SQL 分布式计算 Spark

|

博文

EMR Spark Relational Cache如何支持雪花模型中的关联匹配

在Spark中，Join通常是代价比较大，尤其是shuffle join。Relational Cache将反范式化表（即关联后的大表）保存为relational cache，便可以使用cache重写执行计划，提高查询效率。

4832 0 0

来自：开源大数据平台 E-MapReduce 版块

阿里云实时计算Flink

|

流计算 API Apache

|

博文

Apache Flink 零基础入门（三）：DataStream API 编程

本次课程将首先介绍 Flink 开发中比较核心的 DataStream API 。我们首先将回顾分布式流处理的一些基本概念，这些概念对于理解实际的 DataStream API 有非常大的作用。然后，我们将详细介绍 DataStream API 的设计，最后我们将通过一个例子来演示 DataStre

7508 0 1

来自：实时计算 Flink 版块

隐林

|

分布式计算 MaxCompute

|

博文

MaxCompute MapReduce的7个性能优化策略

本文收录了一些MaxCompute MapReduce优化策略。

5665 0 2

来自：大数据计算 MaxCompute 版块

隐林

|

分布式计算关系型数据库大数据

|

博文

【大数据技巧】数据导入到MaxCompute的技巧汇总

用Fluent实现MySQL到ODPS数据集成 ---可以通过Fluentd将其它系统数据利用DHS导入到ODPS中海量数据计算应该如何选择数据库 ---MaxCompute向用户提供了完善的数据导入方案以及多种经典的分布式计算模型，能够更快速的解决用户海量数据计算问

4773 0 1

来自：大数据计算 MaxCompute 版块

傲海

|

机器学习/深度学习存储 TensorFlow

|

博文

PAI深度学习Tensorflow框架多机多卡多PS Server使用说明

6205 58 58

来自：人工智能平台PAI 版块

隐林

|

存储分布式计算大数据

|

博文

仁人帮探索大数据技术

前两期小帮为大家介绍了仁人帮的大数据定义与大数据在仁人帮后台的应用。今天也不跟大家卖关子了，接下来，小帮为大家奉上的是大数据平台技术的探索。大数据技术，小帮认为可以分成两个大的层面，大数据平台技术与大数据应用技术。

4550 0 1

来自：大数据计算 MaxCompute 版块

付空

|

消息中间件 SQL 供应链

|

博文

【阿里内部应用】利用blink+MQ实现流计算中的超时统计问题

案例与解决方案汇总页：阿里云实时计算产品案例&解决方案汇总一. 背景介绍菜鸟的物流数据本身就有链路复杂、实操节点多、汇总维度多、考核逻辑复杂的特点，对于实时数据的计算存在很大挑战。经过仓配ETL团队的努力，目前仓配实时数据已覆盖了绝大多数场景，但是有这样一类特殊指标：“晚点超时指标”（例如：出库超6小时未揽收的订单量），仍存在实时汇总计算困难。

5442 0 0

来自：实时计算 Flink 版块

祎休

|

存储大数据

|

博文

北京：《云数据·大计算：快速搭建互联网在线运营分析平台》Workshop-入口

该课程是基于大数据时代APP日志分析的基础需求的基础上，给开发者从数据高并发写入及实时在线访问存储到便捷高效的数据加工处理最终再到数据分析与展示的完整链路解决方案。不仅可以了解并实操到阿里云的产品，同时可以自己可以跟着讲师动手完成在线运营分析平台的搭建。

5024 0 0

来自：大数据计算 MaxCompute 版块

阿里云实时计算Flink

|

SQL 流计算消息中间件

|

博文

Flink 1.9 实战：使用 SQL 读取 Kafka 并写入 MySQL

《Flink SQL 1.9.0 技术内幕和最佳实践》，许多小伙伴对演示环节的 Demo 代码非常感兴趣，迫不及待地想尝试下，所以写了这篇文章分享下这份代码。

13948 0 3

来自：实时计算 Flink 版块

隐林

|

关系型数据库 MySQL 大数据

|

博文

基于DataIDE数据集成实现香港ECS上的MySQL数据同步到数加MaxCompute

最近有朋友问，客户在香港ECS上搭建的MySQl，大概有100GB以上的数据，能否通过MaxCompute做海量数据分析，我的回答是YES！但客户担心香港与大陆之前数据连通性问题，我的回答依然是YES！为了让更多个客户不再困扰，笔者做了一份教程，可以通过大数据开发套件中的经典网络进行同步数据

5080 0 0

来自：大数据计算 MaxCompute 版块

隐林

|

SQL 分布式计算大数据

|

博文

最好用的工兵铲—MaxCompute Studio，来了解下！

摘要：在大数据计算北京高端峰会上，阿里云计算平台高级专家薛明深入介绍了阿里巴巴大数据计算平台开发利器—MaxCompute Studio。一站式的 IDE，可以快速完成数据浏览和管理、进行基于 SQL 和 UDF 的数据开发，更具备完善的作业分析和优化辅助等功能。

5227 0 0

来自：大数据计算 MaxCompute 版块

计算爱好者

|

SQL 分布式计算大数据

|

博文

E-MapReduce解决hive comment中文乱码问题

在最新版本的EMR-1.3.0已经解决了hive comment中文乱码问题。如果已经申请了包年包月的集群，用的是老版本，那么可以过下面介绍的步骤解决这个问题。

4804 0 0

来自：开源大数据平台 E-MapReduce 版块

晋恒

|

SQL Web App开发分布式计算

|

博文

阿里云MaxCompute 2018-10月刊

阿里云 MaxCompute 2018-10月新功能发布汇总，更有技术干货、最佳实践等精彩博文推荐，欢迎阅读。

4413 0 0

来自：大数据计算 MaxCompute 版块

隐林

|

人工智能分布式计算大数据

|

博文

【广州云栖大数据/人工智能会场信息】全新一代人工智能引擎MaxCompute惊艳全场

11月22日在广州举办的2017年云栖大会·广东分会今天拉开序幕，小编已经深深感受到了华南地区小伙伴们的热情，针对大家好奇的问题，如本届广东分会阿里云会有什么亮点？邀请了哪些嘉宾？展台会有什么活动等等问题，小编在这里为大家做个现场报道吧！

4571 0 0

来自：大数据计算 MaxCompute 版块

light-rain

|

NoSQL Redis SQL

|

博文

使用Spark Streaming SQL进行PV/UV统计

PV/UV统计是流式分析一个常见的场景。通过PV可以对访问的网站做流量或热点分析，例如广告主可以通过PV值预估投放广告网页所带来的流量以及广告收入。另外一些场景需要对访问的用户作分析，比如分析用户的网页点击行为，此时就需要对UV做统计。

7447 0 0

来自：开源大数据平台 E-MapReduce 版块

开源大数据EMR

|

SQL 分布式计算算法

|

博文

开源大数据周刊-第19期

本周关注：马云谈云计算、大数据、人工智能未来三十年，E-MapReduce存储计算分离，真实的大数据故事，spark session及spark mmlib、presto+oss

4102 0 0

来自：开源大数据平台 E-MapReduce 版块

晋恒

|

存储城市大脑分布式计算

|

博文

阿里关涛谈大规模计算—从数字化阿里到数字化城市的进化

MaxCompute是ET大脑供血系统极其重要的组成部分，如果没有MaxCompute，今天我们将没办法给大家讲述任何一个成功的故事。

5429 0 0

来自：大数据计算 MaxCompute 版块

隐林

|

SQL 分布式计算 MaxCompute

|

博文

MaxCompute 中的Code Generation技术简介

前言在《数据库系统中的Code Generation技术介绍》中，我们简单介绍了一下Code Generation技术及其在大规模OLAP系统，特别是大规模分布式OLAP系统中的重要性。MaxCompute采用了Code Generation技术来提高计算效率。在MaxCompute

4703 0 0

来自：大数据计算 MaxCompute 版块

阿里云实时计算Flink

|

流计算 SQL 监控

|

博文

从 Storm 到 Flink，汽车之家基于 Flink 的实时 SQL 平台设计思路与实践

汽车之家的实时 SQL 平台设计思路与实践，主要从架构及设计思路、基于 Flink SQL 平台的实时数仓的实践及使用案例、后续规划。

8535 3 5

来自：实时计算 Flink 版块

晋恒

|

分布式计算大数据 MaxCompute

|

博文

MaxCompute携手ofo小黄车与阿里妈妈—邀你共赴大数据计算北京高端峰会（含技术干货整理）

ofo小黄车如何通过MaxCompute轻松处理每天千万订单，提升线下运营效率50%以上，提升整体运行效率76%？阿里妈妈在搜索广告、定向广告、达摩盘、报表和BI分析等常见场景下是如何使用MaxCompute的？ Noxmobi自建业界领先的DSP、SSP、ADX等广告系统，其中最重要的底层数.

4400 0 0

来自：大数据计算 MaxCompute 版块

金竹

|

SQL Apache 流计算

|

博文

Apache Flink 漫谈系列(10) - JOIN LATERAL

聊什么上一篇《Apache Flink 漫谈系列 - JOIN算子》我们对最常见的JOIN做了详尽的分析，本篇介绍一个特殊的JOIN，那就是JOIN LATERAL。JOIN LATERAL为什么特殊呢，直观说因为JOIN的右边不是一个实际的物理表，而是一个VIEW或者Table-valued Funciton。

10728 75 80

来自：实时计算 Flink 版块

最新

最热

免费试用

博文

问答

电子书

视频

学习

体验

活动

【最佳实践】如何运用DataWorks数据同步功能，将Hadoop数据同步到阿里云Elasticsearch上

阿里云数加（大数据）打造雄安智慧新区

【阿里内部应用】利用blink CEP实现流计算中的超时统计问题

【ELK入门】Elastic中文社区运维监控实战之架构篇

开源大数据周刊-第54期

MaxCompute 2.0 NewSQL演进之路

技术创业难？看汇合营销如何玩转大数据与机器学习

Flink SQL 功能解密系列 —— 解决热点问题的大杀器MiniBatch

CSV 文档格式

基于Flink和规则引擎的实时风控解决方案

基于阿里云MaxCompute实现游戏数据运营

Apache Flink 漫谈系列(09) - JOIN 算子

Apache Flink 漫谈系列(06) - 流表对偶(duality)性

MaxCompute助力OSS支持EB级计算力

Flink 在人工智能领域的应用实践

Apache Spark中国技术交流社区历次直播回顾（持续更新）

为什么MaxCompute采用列式存储？列式存储和行式存储的主要区别在哪

一场变美盛宴后面的大数据故事

Vectorized Execution Engine in MaxCompute 2.0简介

【最佳实践】如何从AWS中的Elasticsearch索引平滑迁移至阿里云

[使用初学者]如何快速玩转阿里云大数据计算服务MaxCompute

【数据科学老司机在线教学第二期】阿里云大数据生态协同过滤推荐系统实战

欢迎加入Spark中国社区

618粉丝狂欢节来了，你的小邮局爆仓没有？

浅谈 Spark 的多语言支持

为什么选择ali-E-MapReduce

一天造出10亿个淘宝首页，阿里算法工程师如何实现？

产品3周迭代一次，启信宝驾驭8000万企业征信的平台架构

解析DataWorks数据集成中测试连通性失败问题

EMR Spark Relational Cache如何支持雪花模型中的关联匹配

Apache Flink 零基础入门（三）：DataStream API 编程

MaxCompute MapReduce的7个性能优化策略

【大数据技巧】数据导入到MaxCompute的技巧汇总

PAI深度学习Tensorflow框架多机多卡多PS Server使用说明

仁人帮探索大数据技术

【阿里内部应用】利用blink+MQ实现流计算中的超时统计问题

北京：《云数据·大计算：快速搭建互联网在线运营分析平台》Workshop-入口

Flink 1.9 实战：使用 SQL 读取 Kafka 并写入 MySQL

基于DataIDE数据集成实现香港ECS上的MySQL数据同步到数加MaxCompute

最好用的工兵铲—MaxCompute Studio，来了解下！

E-MapReduce解决hive comment中文乱码问题

阿里云MaxCompute 2018-10月刊

【广州云栖大数据/人工智能会场信息】全新一代人工智能引擎MaxCompute惊艳全场

使用Spark Streaming SQL进行PV/UV统计

开源大数据周刊-第19期

阿里关涛谈大规模计算—从数字化阿里到数字化城市的进化

MaxCompute 中的Code Generation技术简介

从 Storm 到 Flink，汽车之家基于 Flink 的实时 SQL 平台设计思路与实践

MaxCompute携手ofo小黄车与阿里妈妈—邀你共赴大数据计算北京高端峰会（含技术干货整理）

Apache Flink 漫谈系列(10) - JOIN LATERAL

大数据与机器学习

活跃用户

相关产品