基于MaxCompute构建Noxmobi全球化精准营销系统
摘要:大数据计算服务(MaxCompute,原名ODPS)是一种快速、完全托管的TB/PB级数据仓库解决方案。MaxCompute向用户提供了完善的数据导入方案以及多种经典的分布式计算模型,能够更快速的解决用户海量数据计算问题,有效降低企业成本,并保障数据安全。
Spark修炼之道(高级篇)——Spark源码阅读:第四节 Stage划分
Stage划分
在上一节中我们讲了 Spark Job的提交,在该讲中我们提到,当rdd触发action操作之后,会调用SparkContext的runJob方法,最后调用的DAGScheduler.handleJobSubmitted方法完成整个job的提交。然后DAGScheduler根据RDD的lineage进行Stage划分,再生成TaskSet,由TaskSche
Spark机器学习2·准备数据(pyspark)

[Spark机器学习](http://book.douban.com/subject/26593179/)
### 准备环境
#### anaconda
```
nano ~/.