Spark的搜索结果_热门_第14页-阿里云开发者社区

祝威廉

|

博文

前些天可以让批处理的配置变得更优雅StreamingPro 支持多输入，多输出配置，现在流式计算也支持相同的配置方式了。另外未来等另外一个项目稳定，会释放出来配合StreamingPro使用，它可以让你很方便的读写HBase,比如可以为HBase 表添加mapping，类似ES的做法,也可以不用mapping，系统会自动为你创建列(familly:column作为列名)，或者将所有列合并成一个字段让你做处理。

# 云数据库 RDS MySQL 版 # 云消息队列 Kafka 版 # SQL # MySQL # Java # 关系型数据库 # 数据库连接 # 分布式计算 # Spark # 消息中间件 # Kafka # Hbase

华章计算机

|

博文

《深入理解Spark:核心思想与源码分析》——1.3节阅读环境准备

# 分布式计算 # Scala # 开发工具 # Android开发 # Spark

知与谁同

|

博文

Spark Streaming vs. Kafka Stream 哪个更适合你

# 云消息队列 Kafka 版 # 消息中间件 # 分布式计算 # Kafka # Apache # Spark

小猫吃鱼569

|

博文

【Spark Summit East 2017】BigDL：Spark上的分布式深度学习库

本讲义出自Yiheng Wang在Spark Summit East 2017上的演讲，主要介绍了使用Spark构建大数据平台的分布式的深度学习框架，其结合了“高性能计算”和“大数据”的架构，为Spark上的深度学习功能提供本地支持，演讲中还分享了用户通过BigDL构建的深度学习的应用程序，BigDL允许开发者使用大数据平台进行统一数据存储、数据处理和挖掘、机器学习以及深度学习等。

# 云原生大数据计算服务 MaxCompute # 机器学习/深度学习 # 分布式计算 # 大数据 # Spark # MaxCompute # 开发者 # 存储 # 数据处理

anzhsoft

|

博文

Spark技术内幕: Shuffle详解（三）

# 分布式计算 # Spark # 调度

桃子红了呐

|

博文

IOT数据库选型——NOSQL，MemSQL，cassandra，Riak或者OpenTSDB，InfluxDB

# 分布式计算 # NoSQL # 物联网 # Spark # 传感器 # Hadoop # 时序数据库 # 分布式数据库 # SQL # Apache

阿里云实时计算Flink

|

博文

|

来自：大数据与机器学习

小米流式平台架构演进与实践

小米业务线众多，从信息流，电商，广告到金融等覆盖了众多领域，小米流式平台为小米集团各业务提供一体化的流式数据解决方案，主要包括数据采集，数据集成和流式计算三个模块。目前每天数据量达到 1.2 万亿条，实时同步任务 1.5 万，实时计算的数据 1 万亿条。

# 实时计算 Flink版 # 云消息队列 Kafka 版 # 云数据库 RDS MySQL 版 # SQL # 消息中间件 # 存储 # 分布式计算 # 监控 # 关系型数据库 # MySQL # Kafka # 流计算 # Spark

liurio

|

博文

使用IDEA开发及测试Spark的环境搭建及简单测试

一、安装JDK(具体安装省略) 二、安装Scala(具体安装省略) 三、安装IDEA 　　1、打开后会看到如下，然后点击OK 　2、点击Next:Default plugins，进入以下页面：　　3、点击Scala的Install安装(确保联网)，等待完成后，出现 ...

# 云原生大数据计算服务 MaxCompute # 分布式计算 # 测试技术 # Apache # Scala # Spark

鱼跟猫

|

博文

|

来自：大数据与机器学习

通过Spark SQL实时归档SLS数据

我在前一篇文章介绍过基于Spark SQL实现对HDFS操作的实时监控报警。今天，我再举例说明一下如何使用Spark SQL进行流式应用的开发。

# 日志服务 # 云消息队列 Kafka 版 # 开源大数据平台 E-MapReduce # SQL # 消息中间件 # 分布式计算 # Kafka # Spark

小猫吃鱼569

|

博文

【Spark Summit East 2017】使用开源大数据软件构建实时防欺诈引擎

本讲义出自Kees Jan de Vries在Spark Summit East 2017上的演讲，骗子总试图使用盗取来的信用卡购买商品，预定机票和酒店等，这伤害了持卡人的信任和供应商在世界各地的业务，本讲义介绍了使用开源大数据软件：Spark, Spark ML, H2O, Hive, Esper等构建的实时防欺诈引擎，并介绍了面对的挑战。

# 云原生大数据计算服务 MaxCompute # 分布式计算 # 大数据 # Spark # MaxCompute # SQL # HIVE

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Spark