【Spark Summit East 2017】在生产环境中的大规模数据应用中使用SparkR

简介: 本讲义出自Heiko Korndorf在Spark Summit East 2017上的演讲,R语言是一个广受平台数据科学家欢迎的应用于许多不同的领域的模型分析创建的语言,但是当这些应用程序从科学实验室迁移到大型企业的生产环境就出现了一系列新的挑战,而独立于R的Spark则是非常强大的通用计算平台,通过引入SparkR使得在生产环境下使用数据科学应用成为了可能,本次演讲将会分享两个将数据科学应用引入真实生产环境的案例。

更多精彩内容参见云栖社区大数据频道https://yq.aliyun.com/big-data;此外,通过Maxcompute及其配套产品,低廉的大数据分析仅需几步,详情访问https://www.aliyun.com/product/odps


本讲义出自Heiko Korndorf在Spark Summit East 2017上的演讲,R语言是一个广受平台数据科学家欢迎的应用于许多不同的领域的模型分析创建的语言,但是当这些应用程序从科学实验室迁移到大型企业的生产环境就出现了一系列新的挑战,而独立于R的Spark则是非常强大的通用计算平台,通过引入SparkR使得在生产环境下使用数据科学应用成为了可能,本次演讲将会分享两个将数据科学应用引入真实生产环境的案例。


30097218ad785274173312c75d96ade9ac2047af

3e6b4bde43ff050170df29e68010aedf9720e45a

25eab99ad160e9f25703e2f85fe7eb65c74f68c9

491961c6d49cabcbec6ccf808897e77b64a7dcd1

27487a63dc7330c657dab6a221bd685d1356d1fc

cf8a753ce7c45749d27bcda7a6499a4c56381357

13b9e99aa53f94869cb72ce4ee26f1b99db5a33c

614c7b7d028e0d079a8a2137ecc22b862cddeb31

b9b3f246463585cf0820924c2e73dcd195553cb4

07889f3151184c08c9d033d6f1b590377df81fa4

18dd87edf78bc4600504a50e7f9616896083b247

f093d4b8353600a4b1af17c69e7f1d561221d197

402d658bc0596343d7c2cc6608989896169e3c39

69f4ce97eb8cfa1f3d62f1265d48f2ca9d188ecb

2229a6d715765f74ae9dd5faed057ac3f5b0029d

fb882d421140ed73fd1532d16a364adc14e8f349

9c377d1c35aa4550449faaedf2db302a804fd000

a28b39deb7331655414009ea2743f44b9b274a5e

7481844022b9c72d0f0f890f6d7a42e419c69b1e

28f3cdb323e372617b7b9865a614c525dc543cfc

e04bc6c2297e98e95897d0e93cf9570665d7bd7a

6a1a7879b8d63182488312d95d4b7ddb81113221

06dd34e2426c9b400228ef68f2e9bb364bcda31e

24a08180e658b3cca2671ce9e8d71172a8b3ae2f

5fd809e0412660da5b872d288bf89db2f4ef1b33

相关文章
|
2月前
|
分布式计算 数据处理 Apache
Spark和Flink的区别是什么?如何选择?都应用在哪些行业?
【10月更文挑战第10天】Spark和Flink的区别是什么?如何选择?都应用在哪些行业?
320 1
|
2月前
|
分布式计算 关系型数据库 MySQL
大数据-88 Spark 集群 案例学习 Spark Scala 案例 SuperWordCount 计算结果数据写入MySQL
大数据-88 Spark 集群 案例学习 Spark Scala 案例 SuperWordCount 计算结果数据写入MySQL
56 3
|
4月前
|
分布式计算 大数据 数据处理
Apache Spark的应用与优势:解锁大数据处理的无限潜能
【8月更文挑战第23天】Apache Spark以其卓越的性能、易用性、通用性、弹性与可扩展性以及丰富的生态系统,在大数据处理领域展现出了强大的竞争力和广泛的应用前景。随着大数据技术的不断发展和普及,Spark必将成为企业实现数字化转型和业务创新的重要工具。未来,我们有理由相信,Spark将继续引领大数据处理技术的发展潮流,为企业创造更大的价值。
|
4月前
|
存储 分布式计算 Java
|
4月前
|
分布式计算 监控 大数据
如何处理 Spark 中的倾斜数据?
【8月更文挑战第13天】
262 4
|
4月前
|
存储 缓存 分布式计算
|
4月前
|
SQL 存储 分布式计算
|
4月前
|
分布式计算 Apache 数据安全/隐私保护
流计算引擎数据问题之在 Spark Structured Streaming 中水印计算和使用如何解决
流计算引擎数据问题之在 Spark Structured Streaming 中水印计算和使用如何解决
62 1
|
4月前
|
分布式计算 Hadoop 大数据
大数据处理框架在零售业的应用:Apache Hadoop与Apache Spark
【8月更文挑战第20天】Apache Hadoop和Apache Spark为处理海量零售户数据提供了强大的支持
78 0
|
存储 分布式计算 Spark
Spark会把数据都载入到内存么?
这篇文章算是个科普贴。如果已经熟悉Spark的就略过吧。
1896 0