【Spark Summit East 2017】使用Spark进行带有高维度标签的机器学习

简介: 本讲义出自Stefan Panayotov与Michael Zargham 在Spark Summit East 2017上的演讲,主要介绍了在Stefan Panayotov和团队使用Spark进行带有高维度标签的机器学习的过程中使用到的工具,遇到的障碍以及围绕使用Databricks尝试构建用于预测不同电视节目的收视率以及人口统计数据的客户机器学习模型所做的工作。

更多精彩内容参见云栖社区大数据频道https://yq.aliyun.com/big-data;此外,通过Maxcompute及其配套产品,低廉的大数据分析仅需几步,详情访问https://www.aliyun.com/product/odps


本讲义出自Stefan Panayotov与Michael Zargham 在Spark Summit East 2017上的演讲,主要介绍了在Stefan Panayotov和团队使用Spark进行带有高维度标签的机器学习的过程中使用到的工具,遇到的障碍以及围绕使用Databricks尝试构建用于预测不同电视节目的收视率以及人口统计数据的客户机器学习模型所做的工作。


d1dc9b21dd6e43d122699c8f3ed6d047c57cf7a2

b093f8bf1408b47b7756e65ca442f902d1ce8191

b60bc6817f5ef62e3c3cffe8445ad79dce989edb

56b86b11e8668ec8b266d4eae310e4d41d687dc6

08dd55301563d74636ec5eb8c296d662d4f2eb6f

50bd7a21aef59bad808713cd7eaba86a620d0b58

b3610f68d92cc5a35b4db720216036c0f6c04fea

613e4c9250b05b819f552e25166d1329929fd69b

c5f6e0dea9f15954e969cfbbffb0684c14aac13b

d681410a290ca12fc8bd3625d1538852f1280e66

a309f7db1961b003df166686e4ca6ba5ebec0e12

18011577bcc15211f11a298c6b95633c345390bd

430465ec1f6933d517c3a21c054d0ddf9b6281ac

a03b48365640d7e3f65ea6f2455f14b4aecb888d

0a00b8396b250f8cc796e79044045c1035a2f3a0

bfd6d596a9965df78d81a1f2b3b5bb9f110b703f

d508565f0ece6aed3388f9d103d4e58e7f3c6b52

fe9eff89f95df6e734920836d505f531e4fed869

f8106f0a57f4786e851345a0f0864757a1eeca9d

d2c90c29a447bfbef17d17ecd1de968c724a8943

79b182a161eb26b54b46ae387ad4c7a5096668d1

3d5f4fee06879e5b56be73f2f58852fe5a31b0ce

1738ba0c4cb12a760c107eb826c4582185304861

fae1c75418c658c4b18ef3580ecbeb3981678bbc

ce8ec487ff61b7b70ed51e2d0f838cb4e2905194

e6fee87f5f6730843bb8f1506f84d75b45b0d7fd

b8882c27327ed6642768f55a80c579a799b99664

a2c719be7e7c16866ff262034af50eafdcb80b02

相关文章
|
3月前
|
机器学习/深度学习 分布式计算 算法
Spark中的机器学习库MLlib是什么?请解释其作用和常用算法。
Spark中的机器学习库MLlib是什么?请解释其作用和常用算法。
37 0
|
7月前
|
机器学习/深度学习 分布式计算 算法
大数据Spark机器学习
大数据Spark机器学习
45 1
大数据Spark机器学习
|
3月前
|
机器学习/深度学习 分布式计算 算法
Spark MLlib简介与机器学习流程
Spark MLlib简介与机器学习流程
|
4月前
|
机器学习/深度学习 人工智能 分布式计算
机器学习(一)Spark机器学习基础
机器学习(一)Spark机器学习基础
36 0
|
4月前
|
机器学习/深度学习 分布式计算 搜索推荐
【大数据技术】Spark MLlib机器学习协同过滤电影推荐实战(附源码和数据集)
【大数据技术】Spark MLlib机器学习协同过滤电影推荐实战(附源码和数据集)
79 0
|
4月前
|
机器学习/深度学习 分布式计算 前端开发
【大数据技术】Spark MLlib机器学习线性回归、逻辑回归预测胃癌是否转移实战(附源码和数据集)
【大数据技术】Spark MLlib机器学习线性回归、逻辑回归预测胃癌是否转移实战(附源码和数据集)
35 0
|
4月前
|
机器学习/深度学习 分布式计算 大数据
【大数据技术】Spark MLlib机器学习特征抽取 TF-IDF统计词频实战(附源码和数据集)
【大数据技术】Spark MLlib机器学习特征抽取 TF-IDF统计词频实战(附源码和数据集)
27 0
|
4月前
|
机器学习/深度学习 分布式计算 算法
【大数据技术】Spark MLlib机器学习库、数据类型详解(图文解释)
【大数据技术】Spark MLlib机器学习库、数据类型详解(图文解释)
47 0
|
11月前
|
机器学习/深度学习 分布式计算 自然语言处理
Spark机器学习管道 - Estimator
Spark机器学习管道 - Estimator
|
7月前
|
机器学习/深度学习 存储 分布式计算
大数据Spark MLlib机器学习
大数据Spark MLlib机器学习
57 1

热门文章

最新文章