基于 Spark 和 TensorFlow 的机器学习实践
大数据以及计算能力的提升,使得AI技术有了突飞猛进的发展。在大数据和AI技术的热潮下,在2019杭州云栖大会机器学习技术专场,阿里云高级技术专家吴威和阿里云技术专家江宇向大家分享了EMR E-Learning平台和平台上新开发的核心特性TensorFlow on Spark。
LC3|视角 开源大数据生态下的高性能分布式文件系统
## 背景介绍
盘古是阿里云自主研发的高可靠、高可用、高性能分布式文件系统,距今已经有将近10年的历史。盘古1.0作为阿里云的统一存储核心,稳定高效的支撑着阿里云ECS、NAS、OSS、OTS、ODPS、ADS等多条业务线的迅猛发展。但最近几年,基于如下两方面的原因,盘古还是重新设计实现了第二代存储引擎盘古2.0,其不只为阿里云,也为集团、蚂蚁金服的多种业务提供了更佳优异的存储服务
#
Spark-1.4.0集群搭建
主要内容
Ubuntu 10.04 系统设置
ZooKeeper集群搭建
Hadoop-2.4.1集群搭建
Spark 1.4.0集群搭建
假设已经安装好Ubuntu操作系统
Ubuntu 10.04设置
1.主机规划
主机名
IP地址
进程号
SparkMaster
192.168.1.103
ResourceManager Dat
基于粒子滤波器的目标跟踪算法及实现
推荐大家看论文《An adaptive color-based particle filter》
这次我直接截图我的硕士毕业论文的第二章的一部分,应该讲得比较详细了。
Hadoop集群部署实战
Hadoop 集群搭建
目录
集群简介
服务器准备
环境和服务器设置
JDK环境安装
Hadoop安装部署
启动集群
测试
集群简介
在进行集群搭建前,我们需要大概知道搭建的集群都是些啥玩意。
Flink on Yarn运行机制
从图中可以看出,Yarn的客户端需要获取hadoop的配置信息,连接Yarn的ResourceManager。所以要有设置有 YARN_CONF_DIR或者HADOOP_CONF_DIR或者HADOOP_CONF_PATH,只要设置了其中一个环境变量,就会被读取。