如何在MaxCompute上运行HadoopMR作业
MaxCompute(原ODPS)有一套自己的MapReduce编程模型和接口,简单说来,这套接口的输入输出都是MaxCompute中的Table,处理的数据是以Record为组织形式的,它可以很好地描述Table中的数据处理过程,然而与社区的Hadoop相比,编程接口差异较大。Hadoop用户如果
阿里云实战第二期之数据处理系列
继阿里云实战第一期之轻松上云系列,我们迎来了第二期数据处理系列,本系列分为,数据采集与同步,数据分析和处理,数据报表及大屏展示,搜索等一系列的大数据产品及服务,助力企业在DT时代更敏捷、更智能、更具洞察力!
Spark机器学习2·准备数据(pyspark)

[Spark机器学习](http://book.douban.com/subject/26593179/)
### 准备环境
#### anaconda
```
nano ~/.
Scala 简介 优点 及 用途
介绍:
Scala 是一种有趣的语言。它一方面吸收继承了多种语言中的优秀特性,一方面又没有抛弃 Java 这个强大的平台,它运行在 Java 虚拟机 (Java Virtual Machine) 之上,轻松实现和丰富的 Java 类库互联互通。它既支持面向对象的编程方式,又支持函数式编程。它写出的程序像动态语言一样简洁,但事实上它确是严格意义上的静态语言。Scala 就像一位武林