Spark的搜索结果_热门_第15页-阿里云开发者社区

华章计算机

|

博文

《Spark大数据分析：核心概念、技术及实践》Spark Core

# 云原生大数据计算服务 MaxCompute # 存储 # 分布式计算 # 算法 # 大数据 # Spark

技术小能手

|

博文

三分钟构建高性能WebSocket服务 | 超优雅的Springboot整合Netty方案

# Web App开发 # Java # 应用服务中间件 # Spring # 流计算 # Apache # 容器 # 分布式计算 # Spark # NoSQL

周志湖

|

博文

Spark修炼之道系列教程预告

课程内容 Spark修炼之道（基础篇）——Linux基础（15讲）、Akka分布式编程（8讲） Spark修炼之道（进阶篇）——Spark入门到精通（30讲） Spark修炼之道（实战篇）——Spark应用开发实战篇（20讲） Spark修炼之道（高级篇）——Spark源码解析（50讲）部分内容会在实际编写时动态调整，或补充、或删除。 Spark修炼之道（基础篇）—

# 云原生大数据计算服务 MaxCompute # 日志服务 # 云解析DNS # SQL # 分布式计算 # 大数据 # Linux # Spark # 流计算 # 算法 # 数据挖掘 # 监控 # Shell

神巧合

|

博文

协同过滤算法 R/mapreduce/spark mllib多语言实现

用户电影评分数据集下载 http://grouplens.org/datasets/movielens/ 1) Item-Based,非个性化的，每个人看到的都一样2) User-Based，个性化的，每个人看到的不一样对用户的行为分析得到用户的喜好后，可以根据用户的喜好计算相似用户和物品，然后可以基于相似用户或物品进行推荐。这就是协同过滤中的两个分支了，基于用户的和基于物品的协同过滤。

# 分布式计算 # 自然语言处理 # 搜索推荐 # 算法 # Spark

明惠

|

博文

|

来自：数据库

Apache Spark Delta Lake 写数据使用及实现原理代码解析

Apache Spark Delta Lake 写数据使用及实现原理代码解析 Delta Lake 写数据是其最基本的功能，而且其使用和现有的 Spark 写 Parquet 文件基本一致，在介绍 Delta Lake 实现原理之前先来看看如何使用它，具体使用如下： df.

# 日志服务 # 云解析DNS # 分布式计算 # Spark # 缓存 # Apache

王小雷

|

博文

spark (java API) 在Intellij IDEA中开发并运行

概述：Spark 程序开发，调试和运行，intellij idea开发Spark java程序。分两部分，第一部分基于intellij idea开发Spark实例程序并在intellij IDEA中运行Spark程序.第二部分，将开发程序提交到Spark local或者hadoop YARN集群运行。Github项目源码图1，直接在intellij IDEA(社区版)

# 分布式计算 # Java # API # Apache # Spark

开源大数据EMR

|

博文

|

来自：大数据与机器学习

开源大数据周刊-第19期

本周关注：马云谈云计算、大数据、人工智能未来三十年，E-MapReduce存储计算分离，真实的大数据故事，spark session及spark mmlib、presto+oss

# 云原生大数据计算服务 MaxCompute # 开源大数据平台 E-MapReduce # SQL # 分布式计算 # 算法 # 大数据 # Spark

周公解闷

|

博文

|

来自：大数据与机器学习

浅谈PyODPS

在我看来，PyODPS就是阿里云上的Python。值得注意的是，这里的定语“阿里云上的”一定不能精简掉，因为PyODPS不等于单机版的Python！

# 云原生大数据计算服务 MaxCompute # 大数据开发治理平台 DataWorks # 分布式计算 # 算法 # 大数据 # MaxCompute # Python # 机器学习/深度学习 # Spark

小猫吃鱼569

|

博文

【Spark Summit EU 2016】TPC-DS基准测试下的Spark SQL2.0使用体验

本讲义出自Berni Schiefer在Spark Summit EU上的演讲，目前而言Spark SQL发展演进的速度非常迅猛，但是大多数情况下还是部署在传统的Hadoop集群上，为了尝试将Spark SQL使用在专为Spark设置的集群上，Berni Schiefer使用了最新版本的Spark SQL应对企业级标准的工作负载。

# SQL # 分布式计算 # 测试技术 # Spark # MaxCompute # Hadoop # 大数据

华章计算机

|

博文

《循序渐进学Spark 》Spark 编程模型

# 存储 # 分布式计算 # 资源调度 # 调度 # Spark

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Spark