Spark 2.4.0编程指南--Spark SQL UDF和UDAF
## 技能标签
- 了解UDF 用户定义函数(User-defined functions, UDFs)
- 了解UDAF (user-defined aggregate function), 用户定义的聚合函数
- UDF示例(统计行数据字符长度)
- UDF示例(统计行数据字符转大写)
...
数据智能需求旺盛 阿里云MaxCompute 2.0华南区开服
8月31日,阿里云宣布将在深圳区域正式部署大数据计算服务MaxCompute,以进一步提升对华南区域客户服务的响应速度,并推动该地域人工智能产业的发展。
此前,凭借大规模计算存储、多种计算模型、强数据安全和低成本的优势,MaxCompute一直供不应求。
DataWorks支持PyODPS类型任务
昨天,DataWorks推出了PYODPS任务类型,集成了Maxcompute的Python SDK,可在DataWorks的PYODPS节点上直接编辑Python代码操作Maxcompute,也可以设置调度任务来处理数据,提高数据开发效率。
Spark机器学习9· 实时机器学习(scala with sbt)

[Spark机器学习](http://book.douban.com/subject/26593179/)
### 1 在线学习
模型随着接收的新消息,不断更新自己;而不是像离线训练一次次重新训练。
一分钟了解阿里云产品:数据集成概述
阿里云的众多产品中,数据集成肯定是其中重要的一员。今天让我们来一起了解下数据集成吧。
什么是数据集成呢?
数据集成(Data Integration),简称CDP,是阿里集团对外提供的稳定高效、弹性伸缩的数据同步平台,为阿里云大数据计算引擎(包括ODPS、分析型数据库、OSPS
MaxCompute 2.0 NewSQL演进之路
10月14日,2017杭州云栖大会·阿里云大数据计算服务(MaxCompute)专场,阿里巴巴计算平台架构师林伟分享了主题《MaxCompute2.0的NewSQL演进之路》,介绍阿里云大数据计算服务MaxCompute 2.0在NewSQL上所做的优化和实践工作。