【Spark Summit East 2017】基于Bluemix Apache Spark服务的数据驱动的水安全

简介: 本讲义出自Vladimir Stemkovski在Spark Summit East 2017上的演讲,主要介绍了非营利性组织Water的使命是致力于为世界各地提供安全饮用水解决方案。IBM的 jStart 团队使用Bluemix Apache Spark服务与气象、经济以及社会数据相结合来寻找行为模式,预测水资源短缺,建议改变车站的运营方式以增加为当地社区提供的安全饮用水。

更多精彩内容参见云栖社区大数据频道https://yq.aliyun.com/big-data;此外,通过Maxcompute及其配套产品,低廉的大数据分析仅需几步,详情访问https://www.aliyun.com/product/odps


本讲义出自Vladimir Stemkovski在Spark Summit East 2017上的演讲,主要介绍了非营利性组织Water的使命是致力于为世界各地提供安全饮用水解决方案。IBM的 jStart 团队使用Bluemix Apache Spark服务与气象、经济以及社会数据相结合来寻找行为模式,预测水资源短缺,建议改变车站的运营方式以增加为当地社区提供的安全饮用水。


86f9c36f45e886e92e888891c662cf98d6100362

3333c5b15d010ea06596487ee6dc0330586467f2

9be37bbf86060b071beb0fb74711c37bf1ae0dd6

a8826eda40e245732473ff6f8156fab2345a4ffb

afe35519169ab20829f76be61a0dc2e69ad3ffc7

888b7652731fa62ac7fb48758a621afc937b0074

55f93849cad2e133204fdcb101b216edfc91b9ff

0cdd542a4d7a9c7bf12c512099a11caf5a242ca9

ae454a2277a3c1bd29b8a3b2eae58eaaf732fdf2

7e1afbf073420709aeadac32fffeb53b0558ada6

相关文章
|
7月前
|
分布式计算 大数据 数据处理
Apache Spark:提升大规模数据处理效率的秘籍
【4月更文挑战第7天】本文介绍了Apache Spark的大数据处理优势和核心特性,包括内存计算、RDD、一站式解决方案。分享了Spark实战技巧,如选择部署模式、优化作业执行流程、管理内存与磁盘、Spark SQL优化及监控调优工具的使用。通过这些秘籍,可以提升大规模数据处理效率,发挥Spark在实际项目中的潜力。
588 0
|
7月前
|
机器学习/深度学习 SQL 分布式计算
Apache Spark 的基本概念和在大数据分析中的应用
介绍 Apache Spark 的基本概念和在大数据分析中的应用
271 0
|
7月前
|
机器学习/深度学习 SQL 分布式计算
介绍 Apache Spark 的基本概念和在大数据分析中的应用。
介绍 Apache Spark 的基本概念和在大数据分析中的应用。
|
5月前
|
分布式计算 运维 Serverless
EMR Serverless Spark服务和EMR Serverless StarRocks服务的比较
**EMR Serverless Spark** 以其出色的稳定性、高效性能、减轻运维负担及成本优化著称,适合大规模数据处理。**EMR Serverless StarRocks** 则以高速查询、存算分离架构和灵活扩缩容见长,侧重企业级功能。两者在不同应用场景中有各自优势,选择应基于具体需求。更多详情,参考阿里云官方资源。
|
2月前
|
分布式计算 大数据 Apache
利用.NET进行大数据处理:Apache Spark与.NET for Apache Spark
【10月更文挑战第15天】随着大数据成为企业决策和技术创新的关键驱动力,Apache Spark作为高效的大数据处理引擎,广受青睐。然而,.NET开发者面临使用Spark的门槛。本文介绍.NET for Apache Spark,展示如何通过C#和F#等.NET语言,结合Spark的强大功能进行大数据处理,简化开发流程并提升效率。示例代码演示了读取CSV文件及统计分析的基本操作,突显了.NET for Apache Spark的易用性和强大功能。
65 1
|
4月前
|
分布式计算 Hadoop 大数据
大数据处理框架在零售业的应用:Apache Hadoop与Apache Spark
【8月更文挑战第20天】Apache Hadoop和Apache Spark为处理海量零售户数据提供了强大的支持
78 0
|
4月前
|
分布式计算 Serverless 数据处理
EMR Serverless Spark 实践教程 | 通过 Apache Airflow 使用 Livy Operator 提交任务
Apache Airflow 是一个强大的工作流程自动化和调度工具,它允许开发者编排、计划和监控数据管道的执行。EMR Serverless Spark 为处理大规模数据处理任务提供了一个无服务器计算环境。本文为您介绍如何通过 Apache Airflow 的 Livy Operator 实现自动化地向 EMR Serverless Spark 提交任务,以实现任务调度和执行的自动化,帮助您更有效地管理数据处理任务。
235 0
|
5月前
|
存储 分布式计算 运维
EMR Serverless Spark服务最佳实践测评
EMR Serverless Spark服务最佳实践测评
146 2
|
5月前
|
分布式计算 Apache Spark
|
6月前
|
分布式计算 运维 Serverless
EMR Serverless Spark服务体验评测报告
EMR Serverless Spark服务体验评测报告
78 2

热门文章

最新文章

推荐镜像

更多