Spark的搜索结果_热门_第13页-阿里云开发者社区

华章计算机

|

博文

《Spark与Hadoop大数据分析》——3.1　启动 Spark 守护进程

本节书摘来自华章计算机《Spark与Hadoop大数据分析》一书中的第3章，第3.1节，作者 [美]文卡特·安卡姆（Venkat Ankam），译吴今朝，更多章节内容可以访问云栖社区“华章计算机”公众号查看。

# 资源管理 # 分布式计算 # 资源调度 # 监控 # Hadoop # Spark

青衫无名

|

博文

数据科学与DevOps之间的差距还有救吗？

文章讲的是数据科学与DevOps之间的差距还有救吗，Packt的Skill Up 2016年调查报告显示，数据科学和DevOps是广大程序员的新宠。JavaScript和Python是数据科学家最常用的基本编程语言也是最受欢迎的，而DevOps则成为未来最大的趋势。

# Devops # API # 程序员 # Python # 机器学习/深度学习 # 分布式计算 # Spark # 敏捷开发 # JavaScript # 前端开发

鱼跟猫

|

博文

|

来自：大数据与机器学习

使用Spark SQL进行流式机器学习计算（上）

今天来和大家简单说一下如何使用Spark SQL进行流式数据的机器学习处理

# 开源大数据平台 E-MapReduce # 云数据库 RDS MySQL 版 # 机器学习/深度学习 # SQL # 分布式计算 # 算法 # Spark

华章计算机

|

博文

《Spark大数据分析实战》——1.4节弹性分布式数据集

# 存储 # 分布式计算 # 算法 # Scala # Spark

桃子红了呐

|

博文

spark pipeline 例子

# 机器学习/深度学习 # 分布式计算 # 算法 # Hadoop # Spark # Apache # NoSQL # 数据挖掘 # SQL

华章计算机

|

博文

Apache Spark机器学习3.3　特征准备

# Web App开发 # 分布式计算 # 算法 # Apache # Spark

华章计算机

|

博文

Apache Spark机器学习.1.2　在机器学习中应用Spark计算

# 机器学习/深度学习 # 分布式计算 # Apache # Spark

继盛

|

博文

|

来自：大数据与机器学习

Spark DataFrame 不是真正的 DataFrame

最早的 "DataFrame" ，来源于贝尔实验室开发的 S 语言。R 语言，作为 S 语言的开源版本，于 2000 年发布了第一个稳定版本，并且实现了 dataframe。pandas 于 2009 年被开发，Python 中于是也有了 DataFrame 的概念。

# 云原生大数据计算服务 MaxCompute # 分布式计算 # API # MaxCompute # Spark # Python # SQL # 存储 # 大数据 # Apache # 索引

知与谁同

|

博文

选择 Parquet for Spark SQL 的 5 大原因

# SQL # 存储 # 分布式计算 # Apache # Spark

青衫无名

|

博文

Typesafe公司正式更名为Lightbend公司

# Java # Scala # 分布式计算 # Spark # 开发者 # API

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Spark