【Spark Summit East 2017】当大数据邂逅学习科学

简介: 本讲义出自Al Essa在Spark Summit East 2017上的演讲,主要介绍了创新的路线,MC Graw Hill公司的在学习科学以及优化学习的工具所做的研究,以及利用Spark和DataBricks建立测评模型解决辨别可能放弃课程学习的高风险学生的难题。

更多精彩内容参见云栖社区大数据频道https://yq.aliyun.com/big-data;此外,通过Maxcompute及其配套产品,低廉的大数据分析仅需几步,详情访问https://www.aliyun.com/product/odps

本讲义出自Al Essa在Spark Summit East 2017上的演讲,主要介绍了创新的路线,MC Graw Hill公司的在学习科学以及优化学习的工具所做的研究,以及利用Spark和DataBricks建立测评模型解决辨别可能放弃课程学习的高风险学生的难题。


最后Al Essa还谈到:虽然技术非常重要,但是使用DataBricks迅速地建立创新工作流也非常重要。

7ec9e6a514f737f7613b1d15aa56e33085225f8b

5d03e02dedef07b22ac6791cf92ce7dac96fffac

f1f9cb211100bbc7856e5164bd6289fcb129119b

ab6e3549055f91a8d302ad99fc7e53d358ccdb7a

28d94214a7484ec8bd5dae03a534919b156602be

ecbf434be2b597a01f8b3e659045d3c9291e401d

f6916aef12d61f7a49c964855d4e1cbe207f1c6b

eb1cb031b0993f144a653284a88d982cd671bcbc

623fac9c8f423c4386e8486f0970f4d2d104a11e

4c48f958e5f0547680d1ba01ca8ef7f70e4e76a6

29cc5b8a303681aa52e79dfa158506be8ff6ec50

b57fde5cf4d95df253d8e01ad607d9851aa845af

caabd6dc484779fcbfb2d23f105f812fda7f21bf

f1cbb5a675cabcf9f22fcb1b5433511af60b0a47

4a4ebc683d1f9db4ed9f12b6956204cc50c3938a

7095c192f33fef2c34828155184fc13d018d8bb3

b8c6d709dd3a7ee0095b32b4d861a8885494561c

e154e92914f93f6ce725d13516304245b854feac

8154eeec18c5e0159476a144c512bd602b880883

5128829fdb791ec23472bf7652ad947bfcf786c6

b8d08954d99c5d11c42326a4564420ccd8ca3afb

10f38730457694813fe7e5b0460bf25ac76a3923

baeaf0d0c5d265570c3adeab515188887d9fbf68

bc2c1db65ebb5ada19e652500d8f10a8ac063435

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
5天前
|
分布式计算 Hadoop 大数据
大数据技术与Python:结合Spark和Hadoop进行分布式计算
【4月更文挑战第12天】本文介绍了大数据技术及其4V特性,阐述了Hadoop和Spark在大数据处理中的作用。Hadoop提供分布式文件系统和MapReduce,Spark则为内存计算提供快速处理能力。通过Python结合Spark和Hadoop,可在分布式环境中进行数据处理和分析。文章详细讲解了如何配置Python环境、安装Spark和Hadoop,以及使用Python编写和提交代码到集群进行计算。掌握这些技能有助于应对大数据挑战。
|
5天前
|
分布式计算 DataWorks 大数据
MaxCompute产品使用合集之可以在什么地方学习大数据计算MaxCompute?
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
5天前
|
分布式计算 DataWorks 大数据
MaxCompute操作报错合集之大数据计算的MaxCompute Spark引擎无法读取到表,是什么原因
MaxCompute是阿里云提供的大规模离线数据处理服务,用于大数据分析、挖掘和报表生成等场景。在使用MaxCompute进行数据处理时,可能会遇到各种操作报错。以下是一些常见的MaxCompute操作报错及其可能的原因与解决措施的合集。
MaxCompute操作报错合集之大数据计算的MaxCompute Spark引擎无法读取到表,是什么原因
|
5天前
|
SQL 分布式计算 大数据
MaxCompute操作报错合集之spark3.1.1通过resource目录下的conf文件配置,报错如何解决
MaxCompute是阿里云提供的大规模离线数据处理服务,用于大数据分析、挖掘和报表生成等场景。在使用MaxCompute进行数据处理时,可能会遇到各种操作报错。以下是一些常见的MaxCompute操作报错及其可能的原因与解决措施的合集。
|
5天前
|
分布式计算 大数据 数据处理
[AIGC大数据基础] Spark 入门
[AIGC大数据基础] Spark 入门
143 0
|
5天前
|
机器学习/深度学习 SQL 分布式计算
Apache Spark 的基本概念和在大数据分析中的应用
介绍 Apache Spark 的基本概念和在大数据分析中的应用
168 0
|
5天前
|
机器学习/深度学习 SQL 分布式计算
介绍 Apache Spark 的基本概念和在大数据分析中的应用。
介绍 Apache Spark 的基本概念和在大数据分析中的应用。

热门文章

最新文章