实时计算 Flink SQL 核心功能解密
Flink SQL 是于2017年7月开始面向集团开放流计算服务的。虽然是一个非常年轻的产品,但是到双11期间已经支撑了数千个作业,在双11期间,Blink 作业的处理峰值达到了5+亿每秒,而其中仅 Flink SQL 作业的处理总峰值就达到了3亿/秒。
公开课01期 | 基于宜搭的《T恤尺码收集》应用搭建
在阿里,T恤是程序员必不可少的元素。每逢公司或者BU(部门)的重大节庆日,比如双11 、年会、新BU成立仪式、大型活动等,都会给员工定制发放统一的T恤或者POLO衫服装。而我们每次发放T恤之前,有一步必不可少的就是收集员工的T恤尺码。
【转载】时隔一年多,我又用起了 Superset
去年 6 月份在流利说提离职后,leader 问我为什么要走。我说,流利说有很健全的数据处理基础设施,但这不是所有的公司都会有的条件,所以我想看看在一个基建不全的创业公司我是否也可以像现在一样做的好。
品《阿里巴巴大数据实践-大数据之路》一书(下)
今天继续谈阿里的这本书,包括数据服务平台、数据挖掘平台、数据建模、数据管理及数据应用,希望于你有启示。
1、数据服务平台
数据服务平台可以叫数据开放平台,数据部门产出海量数据,如何能方便高效地开放出去,是我们一直要解决的难题,在没有数据服务的年代,阿里的数据开放的方式简单、粗暴,一般是直接将数据导出给对方,我想,现在大多公司的开放应该也是如此吧,虽然PaaS喊了这么多年,但真正成就的又有几个?
即使如阿里,在数据开放这个方向上的探索和实践,至今也有7个年头了,任何关于数据开放毕其功于一役的做法都将失败,任何一次数据开放的改进都是伴随着对于业务理解的深入而成长起来的。
使用SqlServer建立数据仓库
本文介绍了一个数据仓库从无到有的建立过程,包括设计维度表、事实表,数据抽取,数据可视化。使用SQlServer2008R2制作,数据源为Mysql官方示例数据集。