Spark的搜索结果_热门_第11页-阿里云开发者社区

小猫吃鱼569

|

博文

【Spark Summit East 2017】Apache Toree：Spark的一种Jupyter内核

本讲义出自Marius van Niekerk在Spark Summit East 2017上的演讲，主要介绍了Toree的设计思想，Toree如何与Jupyter生态系统交互，以及用户如何借助强大的插件系统来扩展Apache Toree的功能。

# 分布式计算 # Apache # Spark

wsc449

|

博文

Spark的几种运行模式

应用场景 spark是基于内存计算的计算框架，性能很强悍，但是它支持单机模式，同时也支持集群模式，它的运行模式有好多种，为了不混淆方便区分，这里进行一些总结。

# 资源管理 # 分布式计算 # 资源调度 # Hadoop # Spark # 容器

明惠

|

博文

|

来自：数据库

使用 Kafka + Spark Streaming + Cassandra 构建数据实时处理引擎

Apache Kafka 是一个可扩展，高性能，低延迟的平台，允许我们像消息系统一样读取和写入数据。我们可以很容易地在 Java 中使用 Kafka。 Spark Streaming 是 Apache Spark 的一部分，是一个可扩展、高吞吐、容错的实时流处理引擎。

# 云消息队列 Kafka 版 # 消息中间件 # 分布式计算 # NoSQL # Kafka # Spark

阿里云实时计算Flink

|

博文

|

来自：大数据与机器学习

美团点评基于 Flink 的实时数仓平台实践

数据仓库的建设是“数据智能”必不可少的一环，也是大规模数据应用中必然面临的挑战，而 Flink 实时数仓在数据链路中扮演着极为重要的角色。本文中，美团点评高级技术专家鲁昊为大家分享了美团点评基于 Apache Flink 的实时数仓平台实践。

# 实时计算 Flink版 # 实时数仓 Hologres # 云原生数据仓库AnalyticDB MySQL版 # 数据安全中心 # 云消息队列 Kafka 版 # 日志服务 # 存储 # SQL # 消息中间件 # 机器学习/深度学习 # 分布式计算 # OLAP # Kafka # 调度 # 流计算 # Spark

你们的好朋友

|

博文

11月11日云头条：86分钟1207亿，天猫双11背后的数字增长秘密；2020年，将成为边缘计算的“突破年”？

11月11日，最新云头条快讯 !

# 物联网边缘计算 # 边缘计算 # 分布式计算 # Apache # 双11 # Spark

周志湖

|

博文

Spark修炼之道（基础篇）——Linux大数据开发基础：第四节：Linux文件系统（二）

本节主要内容访问控制列表ACL 链接压缩和归档文件其他日常管理实用程序 1. 访问控制列表ACL 在实际使用使用过程中，可能linux系统自身权限控制不能满足要求，还需要进一步细化，此时可以用ACL（ Access Control List ）进行，它主要提供 owner,group,others 的 read,write,execute 权限之外的细部权限配置

# 云原生大数据计算服务 MaxCompute # 分布式计算 # 大数据 # Linux # 数据安全/隐私保护 # Spark

小金子

|

博文

Spark-Spark Streaming例子整理(一)

（摘自王家林）流（Streaming），在大数据时代为数据流处理，就像水流一样，是数据流；既然是数据流处理，就会想到数据的流入、数据的加工、数据的流出。

# 日志服务 # 云原生大数据计算服务 MaxCompute # 微服务引擎 # 云消息队列 Kafka 版 # 消息中间件 # 分布式计算 # 监控 # Spark # 流计算

开源大数据EMR

|

博文

|

来自：大数据与机器学习

开源大数据周刊-第7期

运行于云端的Hadoop——数据即服务的论证，预先知晓Hadoop3.0新特性。

# 云原生大数据计算服务 MaxCompute # 开源大数据平台 E-MapReduce # 分布式计算 # 大数据 # Hadoop # Apache # 编译器 # 流计算 # Spark # 资源调度 # 容器 # NoSQL

元乙

|

博文

|

来自：云存储

IOT/智能设备日志解决方案（3）：上下游对接

当数据从遍布全球的设备端以及服务端采集上来后，最先会到达数据队列。队列承载所有数据的入口和出口，必须具备的两大能力是： * 丰富的上下游对接能力：数据要能从各种方式接入上来，也能够非常容易的对接各个系统。

# 日志服务 # 监控 # 物联网 # 流计算 # 弹性计算 # SQL # 分布式计算 # HIVE # 容器 # Kubernetes # Spark

周志湖

|

博文

Spark修炼之道（基础篇）——Linux大数据开发基础：第八节：网络管理

本节主要内容 ifconfig命令网络配置其它常用网络管理命令 1. ifconfig命令 ifconfig命令主要用于配置网络接口，如果不加任何参数，则ifconfig命令用于查看当前所有活动网络接口的状态信息，例如：图中的eth0表示活动的以太网接口，对应的描述信息中给出了网络的整体状况信息包括网络类型、MAC地址、IP地址、子网掩码等等，lo表示本地环回

# 云原生大数据计算服务 MaxCompute # 云虚拟主机 # 云解析DNS # 分布式计算 # 网络协议 # Linux # 虚拟化 # Spark

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Spark