开发者社区大数据文章正文

【Spark Summit East 2017】Spark + Flashblade

2017-02-19 2130

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 本讲义出自Brian Gold在Spark Summit East 2017上的演讲，现代基础设施和应用程序会产生大量的日志和遥测数据，Pure Storage能从工程台、制造伙伴和测试站的运行的存储系统获取超过5PB第一手日志数据，演讲中介绍了Pure Storage公司从扩展数据仓库和利用Apache Spark的功能满足分析需求的过程中吸取的经验教训。

更多精彩内容参见云栖社区大数据频道https://yq.aliyun.com/big-data；此外，通过Maxcompute及其配套产品，低廉的大数据分析仅需几步，详情访问https://www.aliyun.com/product/odps。

本讲义出自Brian Gold在Spark Summit East 2017上的演讲，现代基础设施和应用程序会产生大量的日志和遥测数据，Pure Storage能从工程台、制造伙伴和测试站的运行的存储系统获取超过5PB第一手日志数据，演讲中介绍了Pure Storage公司从扩展数据仓库以及利用Apache Spark的功能满足分析需求的过程中吸取的经验教训。

7df7cd3dfb5fdcca2ff03b5707ecf6c571682006

0a87d7fdba001751ab008a7d16d05facf076b8c3

8db5a066fe1438066b6f4544484f0b7534765a27

035fd1f0dc183c35a8a7d8929822e2faf5f325c3

c7db76c8f39f8bec53be951e05e829c2bdce7c1e

be38b89ec27ab0b90e7304a08e0ec67c021d90f1

8610a1438473918a9c74c2a858769eaac3277200

8988aff0ab5f60d5b59c84e3b657d0dad5add961

74c087e1a6b95d7406088d1b4e3f54b5fd657029

f732d15abe7371fb8385932842ccdce81645b7eb

72a506e9ee297db3ed916bfd4c9e0c890507d2b7

c3dc2686701bccb5223fdf1a48b4856d1450ad2b

55a3a562c6c70dfbf63191072139b48ee85995ef

5e92dcfc1bbdc21c10d92144468f5c2a21c8349e

927ac4231b8779fc86732db44bab5ed436554c21

7f3b229ffb55e461a1ab6ba55ce2f89b15f2ea26

74592467d9cbead895b1e036a64a4c34eec5a785

453d4c70e368665cf202f8054513e547102c5ec4

0c15c84886dbca5e93782637695a735971e6ca62

文章标签：

Apache

大数据

分布式计算

Spark

MaxCompute

关键词：

apache spark summit

apache spark east

小猫吃鱼569

开源大数据EMR

人工智能分布式计算大数据

Spark + AI Summit 2020 中文议题有奖征集

北美 Spark + AI Summit 2020 盛会在即，Apache Spark 中国技术交流社区在此诚邀各位，代表国内开发者选择您最希望听到的主题，届时社区将联合国内顶尖技术专家一一展开中文形式分享。

开源大数据EMR

1285 0 1

阿里云E-MapReduce团队

SQL 人工智能分布式计算

回顾 | SPARK + AI SUMMIT 2020 中文精华版线上峰会圆满结束（附PPT下载）

超乎你想象的干货合集打包带走！

阿里云E-MapReduce团队

22961 0 0

回顾 | SPARK + AI SUMMIT 2020 中文精华版线上峰会圆满结束（附PPT下载）

阿里云E-MapReduce团队

人工智能分布式计算 Spark

SPARK + AI SUMMIT 2020 中文精华版线上峰会材料

阿里云E-MapReduce团队

1034 0 0

阿里云E-MapReduce团队

机器学习/深度学习人工智能分布式计算

SPARK + AI SUMMIT 2020 中文精华版线上峰会—7月5日议题

SPARK + AI SUMMIT 2020 中文精华版线上峰会—7月5日议题介绍

阿里云E-MapReduce团队

1828 0 0

阿里云E-MapReduce团队

分布式计算 Prometheus Kubernetes

SPARK + AI SUMMIT 2020 中文精华版线上峰会—7月4日上午议题

SPARK + AI SUMMIT 2020 中文精华版线上峰会—7月4日上午议题发布

阿里云E-MapReduce团队

2528 0 0

SPARK + AI SUMMIT 2020 中文精华版线上峰会—7月4日上午议题

阿里云E-MapReduce团队

SQL 人工智能缓存

Spark 10年，作者 Matei 在 Spark + AI Summit 2020 上深情回顾，Photon 引擎首次曝光

在Spark + AI Summit 2020上， Matei 先生的keynote对 Spark 10 年做了非常精彩的演讲和深情的回顾。SparkSQL 重回巅峰，在性能上大幅超越 Presto。在过去几年，我们见过了太多的 benchmark，大家都在纷纷超越 Spark。Spark 3.0 这一进展可以说大大提振了大家对 Spark 的信心，可谓及时雨。

阿里云E-MapReduce团队

2884 0 0

Spark 10年，作者 Matei 在 Spark + AI Summit 2020 上深情回顾，Photon 引擎首次曝光

阿里云E-MapReduce团队

机器学习/深度学习人工智能分布式计算

Spark + AI summit 2019北美技术峰会华丽落幕

本次SAIC含盖了数据工程与数据科学的内容，包括AI产品化的最佳实践案例分享：超大数据规模下，利用流数据处理确保训练数据更新的时效性，完成数据质量监控，测试以及数据模型服务。也有对流行的软件框架如TensorFlow，SciKit-Learn，Keras，PyTorch，DeepLearning4J，BigDL以及Deep Learning Pipelines等，分别进行深入的主题分享探讨。

阿里云E-MapReduce团队

1325 0 0

寒凝雪

机器学习/深度学习分布式计算大数据

Spark Summit EU重头戏：TensorFlow、结构化的流和GPU硬件加速

寒凝雪

1621 0 0

小猫吃鱼569

分布式计算 Hadoop 流计算

【Hadoop Summit Tokyo 2016】像搭乐高一样搭建Storm与Spark Streaming Pipelines块

本讲义出自Arun Murthy在Hadoop Summit Tokyo 2016上的演讲，主要介绍了Arun Murthy与团队的从各种流使用中学习到的最佳实践和经验，演讲的内容非常简单易懂并且非常有趣，在演讲的最后还介绍了像搭乐高一样搭建Storm与Spark Streaming Pipelines块的相应工具。

小猫吃鱼569

2592 0 0

小猫吃鱼569

分布式计算安全 Hadoop

【Hadoop Summit Tokyo 2016】Apache Spark & Apache Zeppelin的安全状态

本讲义出自Vinay Shukla在Hadoop Summit Tokyo 2016上的演讲，主要介绍了 Spark的安全体系、以及YARN AM上的Spark驱动以及Kerberos身份验证等相关内容，最后还介绍了SparkSQL的相关内容。

小猫吃鱼569

3009 0 0

【Spark Summit East 2017】Spark + Flashblade

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

【Spark Summit East 2017】Spark + Flashblade

热门文章

最新文章

相关课程

相关电子书