开发者社区大数据文章正文

【Spark Summit East 2017】Clipper：一个低延迟在线预测服务系统

2017-02-20 3059

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 本讲义出自Dan Crankshaw在Spark Summit East 2017上的演讲，主要介绍了Clipper——一个通用的低延迟预测服务系统，介于最终用户应用程序和各种机器学习框架之间的Clipper模块化的体系结构来简化对于模型的跨框架部署，此外，Clipper通过引入缓存、批处理和自适应模型选择技术，减少了预测延迟并且提高了吞吐量和预测精度以及系统的鲁棒性。

更多精彩内容参见云栖社区大数据频道https://yq.aliyun.com/big-data；此外，通过Maxcompute及其配套产品，低廉的大数据分析仅需几步，详情访问https://www.aliyun.com/product/odps。

本讲义出自Dan Crankshaw在Spark Summit East 2017上的演讲，主要介绍了Clipper——一个通用的低延迟预测服务系统，介于最终用户应用程序和各种机器学习框架之间的Clipper模块化的体系结构来简化对于模型的跨框架部署，此外，Clipper通过引入缓存、批处理和自适应模型选择技术，减少了预测延迟并且提高了吞吐量和预测精度以及系统的鲁棒性。

9bbff1f43dd80c9ad11776ed1e4b2df3e4be09e3

a05f136178dd8984d9d9cea641a8ed6ba4bca168

84fcf9cb07b35ed4ec6f6a4574ec7e42a0025ca6

4b894c0668b00b26ca3883b20e9ffc68ee64467b

51f83137423aad62d36bb761323af3fe4738f657

60f8add1eeb0aef67405620857bfa5e86615e617

a5e39a13c2ea73f25af802ad2800b63462c75be1

3a0537094d6251d2dc6385c38bc6cbcf8f7a9f89

3744baf898958fcaad0fe875f6e8cd2abf63a707

22e60ce7f2cf229cdd3aae86fe47db154dad6ba5

23f14bdac4fee56cf2973416a3d2edd6359c45a3

11774631269c89a88138fa90d1d9e029c8c2e5e5

e5608a95c2c3541ef92a27db580978b898f32ba2

d96ab56800cdfd35bfa46fb91bb5b050cd64dcf7

3683ad436f41d2453c096965c40af41cb395986e

69ed21fd14eac72d6eaf78f6677f64d9be86ec9e

224f807ae5928315bf374db0628efda28369a2ee

b3fc129ade56568d486843b8f46533f6ac10f6e7

56a6a948fa918d127c20ff9fde1ff7ffe5ed62ec

1da04b317a881594f715510892f6a6fc14da5281

8106c015b4d850079ebaa33479973ecca8f9061d

4cb613bd40039d6c562131fc436b888c6219bfad

3afeab4ca85143c855edbeddbcf36ccb573a9b51

1527cd614c509046361d1cd06e7cbb7655ad1315

5e091fb78dd5f61577b8abe9cb3539d50ef904d8

d04e11fa08a8488c08c76f7d7deff63f0b9e0224

0b20eb0791c91682843d35aece21dd8d83362a17

ef4d0666d9aef60fe8e67ee7ed53813af034dc57

416e95e16f57f3dcbcf8ef67d7ad927fc0dd6415

8c08f4f00411741630c1f939c4e8022a19c224cf

7c959a3e2b6b6ec3a378bf25c0b023d20e77576f

ec439ec40973a10d0044f940dc9d746aedbd5c57

98b4078c1983d2d6947152b7f73b8f7bd5b3a3ec

109ddc72700cd0cfb80e6356edc7de6f316c086a

30513c22557b75548f4bc8ab6b56752cae131966

f4de57a66377edea04c0aaf77290cac69284f98a

b67e122e0982fc8bf9c0b077de491ead74710bfe

f8b7cad5c1f679672acf567d830654f178466800

95da709ad395174da885eeb5718dccc7935ddd52

a4439dc26e83bb6baa3eebc3657bac40d38deaf1

c7169ad067688324aa33f2e9d28c4c962b4083e9

ec3d5bd98dcfe9cb296a5a7db1ee33912d4bd4a2

57285767bb5447d5bfa896aaac853f74a5f72c97

28cc58786c7f948d740a79e475f57e5d296a1aae

文章标签：

大数据

分布式计算

Spark

关键词：

apache spark服务

apache spark系统

apache spark延迟

apache spark summit服务

apache spark summit east系统

小猫吃鱼569

小云悠悠zZ

SQL 分布式计算 Java

Apache IoTDB开发系统整合之Spark IoTDB Connecter

以下 TsFile 结构为例： TsFile 架构中有三个度量：状态、温度和硬件。

小云悠悠zZ

282 0 0

人物我非-32022

5月前

分布式计算运维 Serverless

EMR Serverless Spark服务和EMR Serverless StarRocks服务的比较

**EMR Serverless Spark** 以其出色的稳定性、高效性能、减轻运维负担及成本优化著称，适合大规模数据处理。**EMR Serverless StarRocks** 则以高速查询、存算分离架构和灵活扩缩容见长，侧重企业级功能。两者在不同应用场景中有各自优势，选择应基于具体需求。更多详情，参考阿里云官方资源。

人物我非-32022

121 4 4

郑小健

4月前

存储分布式计算资源调度

Hadoop生态系统概览：从HDFS到Spark

【8月更文第28天】Hadoop是一个开源软件框架，用于分布式存储和处理大规模数据集。它由多个组件构成，旨在提供高可靠性、高可扩展性和成本效益的数据处理解决方案。本文将介绍Hadoop的核心组件，包括HDFS、MapReduce、YARN，并探讨它们如何与现代大数据处理工具如Spark集成。

郑小健

361 0 0

叫做饺子

5月前

存储分布式计算运维

EMR Serverless Spark服务最佳实践测评

叫做饺子

146 2 2

BetterBench

4月前

分布式计算 Java Linux

【Deepin 20系统】Linux 系统安装Spark教程及使用

在Deepin 20系统上安装和使用Apache Spark的详细教程，包括安装Java JDK、下载和解压Spark安装包、配置环境变量和Spark配置文件、启动和关闭Spark集群的步骤，以及使用Spark Shell和PySpark进行简单操作的示例。

BetterBench

88 0 0

sunrr

6月前

分布式计算运维 Serverless

EMR Serverless Spark服务体验评测报告

sunrr

78 2 2

孜倦与shine

6月前

机器学习/深度学习分布式计算算法

基于Spark中随机森林模型的天气预测系统

孜倦与shine

162 1 1

1279963611608989

6月前

分布式计算 Serverless 数据处理

Serverless Spark计算服务

1279963611608989

56 0 0

1941623231718325

6月前

分布式计算 Serverless 数据处理

EMR Serverless Spark服务体验评测

随着云计算的普及和大数据技术的快速发展，企业对于数据处理与分析的需求日益增加。EMR Serverless Spark作为一款云原生、全托管的Spark计算产品，旨在为企业提供一站式的数据处理解决方案。本文将对EMR Serverless Spark服务进行体验评测，重点关注产品内引导、功能满足度、改进建议以及可能的联动组合等方面。

1941623231718325

67 0 0

热烈的马

7月前

存储 Java 关系型数据库

【Kafka+Flume+Mysql+Spark】实现新闻话题实时统计分析系统（附源码）

热烈的马

204 1 1

【Spark Summit East 2017】Clipper：一个低延迟在线预测服务系统

热门文章

最新文章

相关课程

相关电子书

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

【Spark Summit East 2017】Clipper：一个低延迟在线预测服务系统

热门文章

最新文章

相关课程

相关电子书