Spark的搜索结果_热门_第7页-阿里云开发者社区

技术小能手

|

博文

三分钟构建高性能WebSocket服务 | 超优雅的Springboot整合Netty方案

# Web App开发 # Java # 应用服务中间件 # Spring # 流计算 # Apache # 容器 # 分布式计算 # Spark # NoSQL

神巧合

|

博文

协同过滤算法 R/mapreduce/spark mllib多语言实现

用户电影评分数据集下载 http://grouplens.org/datasets/movielens/ 1) Item-Based,非个性化的，每个人看到的都一样2) User-Based，个性化的，每个人看到的不一样对用户的行为分析得到用户的喜好后，可以根据用户的喜好计算相似用户和物品，然后可以基于相似用户或物品进行推荐。这就是协同过滤中的两个分支了，基于用户的和基于物品的协同过滤。

# 分布式计算 # 自然语言处理 # 搜索推荐 # 算法 # Spark

小猫吃鱼569

|

博文

【Spark Summit EU 2016】TPC-DS基准测试下的Spark SQL2.0使用体验

本讲义出自Berni Schiefer在Spark Summit EU上的演讲，目前而言Spark SQL发展演进的速度非常迅猛，但是大多数情况下还是部署在传统的Hadoop集群上，为了尝试将Spark SQL使用在专为Spark设置的集群上，Berni Schiefer使用了最新版本的Spark SQL应对企业级标准的工作负载。

# SQL # 分布式计算 # 测试技术 # Spark # MaxCompute # Hadoop # 大数据

华章计算机

|

博文

Apache Spark机器学习.1.8　Spark notebook简介

# 机器学习/深度学习 # 分布式计算 # 数据可视化 # Apache # Spark

开源大数据EMR

|

博文

|

来自：大数据与机器学习

Apache Spark3.0什么样？一文读懂Apache Spark最新技术发展与展望

阿里巴巴高级技术专家李呈祥带来了《Apache Spark 最新技术发展和3.0+ 展望》的全面解析，为大家介绍了Spark在整体IT基础设施上云背景下的新挑战和最新技术进展，同时预测了Spark 3.0即将重磅发布的新功能。

# 开源大数据平台 E-MapReduce # 容器服务Kubernetes版 # GPU云服务器 # 云原生大数据计算服务 MaxCompute # 对象存储 # 机器学习/深度学习 # 存储 # 分布式计算 # Apache # Spark

周志湖

|

博文

Spark修炼之道（进阶篇）——Spark入门到精通：第七节 Spark运行原理

作者：周志湖网名：摇摆少年梦微信号：zhouzhihubeyond 本节主要内容 Spark运行方式 Spark运行原理解析本节内容及部分图片来自： http://blog.csdn.net/book_mmicky/article/details/25714419 http://blog.csdn.net/yirenboy/article/detai

# 资源管理 # 分布式计算 # 资源调度 # Spark

小猫吃鱼569

|

博文

【Spark Summit EU 2016】60 TB+数据规模的Spark产品用例

本讲义出自Sital Kedia在Spark Summit EU上的演讲，主要介绍了60 TB+数据规模的Spark产品用例，他在开始时首先介绍了实体排序的用例，然后介绍之前使用Hive进行的实现以及现在使用Spark的实现方式，并对于两种实现方式进行了对比。

# 分布式计算 # Spark

小猫吃鱼569

|

博文

【Spark Summit East 2017】Kafka、YARN与Spark Streaming作为一个服务

本讲义出自Jim Dowling在Spark Summit East 2017上的演讲，主要介绍了在容易进行调试的YARN上构建多租户Spark streaming应用程序的过程中遇到的挑战，并展示了如何使用ELK技术栈对Spark streaming应用程序进行日志记录和调试，以及如何使用Graphana和Graphite对应用进行监控以及优化以及使用Dr Elephant终止Spark streaming任务。

# 云消息队列 Kafka 版 # 分布式计算 # 监控 # 大数据 # 流计算 # Spark

sh_jepson

|

博文

记录CDH5.10一个clients.NetworkClient: Bootstrap broker ip:9092 disconnected问题

1.当前环境使用的稳定版本组合a.本套环境CDH经过四次升级，当然版本为CDH-5.10.0-1.cdh5.10.0.p0.41b.KAFKA版本为KAFKA-2.

# 云消息队列 Kafka 版 # 消息中间件 # 前端开发 # Java # Kafka # 分布式计算 # Spark # Apache # Shell # Maven # 数据库

小猫吃鱼569

|

博文

【Spark Summit EU 2016】MLeap + Combust.ML：帮你直接将Spark Pipelines部署到生产环境

本讲义出自Mikhail Semeniuk与Hollin Wilkins在Spark Summit EU上的演讲，主要介绍了如何通过MLeap + Combust.ML帮助开发者直接将Spark Pipelines部署到生产环境上去。

# 分布式计算 # 算法 # Spark

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Spark