Spark内置图像数据源初探 | 6月27号云栖夜读

简介: 今天的首篇文章,讲述了:作者:林武康,花名知瑕, 阿里巴巴计算平台事业部EMR团队的高级开发工程师,Apache HUE Contributor, 参与了多个开源项目的研发工作,对于分布式系统设计应用有较丰富的经验,目前主要专注于EMR数据开发相关的产品的研发工作。

点击订阅云栖夜读日刊,专业的技术干货,不容错过!

阿里专家原创好文

1.Spark内置图像数据源初探

作者:林武康,花名知瑕, 阿里巴巴计算平台事业部EMR团队的高级开发工程师,Apache HUE Contributor, 参与了多个开源项目的研发工作,对于分布式系统设计应用有较丰富的经验,目前主要专注于EMR数据开发相关的产品的研发工作。阅读更多》》

2.MaxCompute 费用暴涨之新增SQL分区裁剪失败

一篇干货好文,值得一读!阅读更多》》

3.Linus 本尊来了!为什么 KubeCon 越来越火?

从200人的小会议到3500 多位云原生和开源领域工程师齐聚一堂的大会,KubeCon 只用了四年,昨天,在KubeCon China 2019 上阿里巴巴宣布开源 OpenKruise,今天,Linus 本尊竟然现身会场!现在,我们继续连线会场,探索阿里云为开发者带来的多份重磅献礼。阅读更多》》

4.Flutter for Web 详细预研

Google在最新的Google I/O上推出了Flutter for Web,旨在进一步解决一次代码,多端运行的问题。Flutter for Web还处于早期试验版,官方不建议在生产环境上使用。那么到底它的实际情况怎么样呢? 我们做了一次预研。期望这次预研的结果可以帮你决定是用,还是不用FFW。阅读更多》》

5.蚂蚁区块链BaaS:开放在云端,落地于实体

自 2018 年 6 月上线以来,蚂蚁区块链 BaaS 不断在技术上实现突破,形成自身独特的优势,并做为行业领军者在不同领域的几十个场景实现落地。在区块链的商用时代加速到来之际,通过开放自身的技术体系,与国内外各合作伙伴一起来构建一个更大的信任体系,赋能于全球实体经济,将是蚂蚁区块链接下来整体的战略路线。阅读更多》》

视频课程及PPT下载

1.【云吞铺子】时延敏感业务超时问题分析(二)
《云吞铺子-故障排查案例精选》第9期如期而至!本期我们继续跟随阿里云售后技术专家月宾聚焦《时延敏感业务超时问题分析》。网络经典案例,不可错过哦!
视频地址:https://yq.aliyun.com/live/1215

2.阿里云智能多端小程序产品解读
2019年将是小程序爆发的一年,我们从不同领域的行业中也明显感受到智能多端小程序整体正在进入高速的发展期,而小程序的生态发展越来越快,还有在观望的同学么?如何选择阿里云智能多端小程序呢?那就报名此次阿里云多端小程序产品解读,将与你分享经典案例,让你不再错过!
PTT下载:https://yq.aliyun.com/live/1147

3.1.1 HBase基本知识及案例分析
视频地址:https://yq.aliyun.com/live/940
PTT下载地址:https://yq.aliyun.com/download/3022

更多直播精彩直播

热门话题

1.小程序的发展越来越快,你还在观望吗?一起来聊聊你眼中的小程序吧!(有奖话题)

  • 你眼中的小程序
  • 你对小程序有什么期待?

点此进入回答赢取礼物

2.“网红”科技—数据中台,离你的企业有多远?(有奖话题)

  • 您所理解的数据中台和数据仓库,有什么样的区别?
  • 您所在的企业是否在做数字化转型?在数字化转型的过程中,遇到过怎样的挑战和困难?
  • 您正在使用的数据构建、管理、分析工具或系统有哪些?这些工具或者系统是否满足您当前的需要?

点此进入回答赢取礼物

往期精彩回顾

阿里开源!云原生应用自动化引擎 OpenKruise | 直击 KubeCon | 6月26号云栖夜读

点击订阅云栖夜读日刊,专业的技术干货,不容错过!

目录
相关文章
|
8月前
|
分布式计算 关系型数据库 分布式数据库
大数据Spark外部数据源
大数据Spark外部数据源
53 0
|
4月前
|
分布式计算 数据处理 Apache
Spark Streaming与数据源连接:Kinesis、Flume等
Spark Streaming与数据源连接:Kinesis、Flume等
|
5月前
|
分布式计算 监控 分布式数据库
Spark Day05:Spark Core之Sougou日志分析、外部数据源和共享变量
Spark Day05:Spark Core之Sougou日志分析、外部数据源和共享变量
61 0
|
5月前
|
SQL 分布式计算 Java
Note_Spark_Day08:Spark SQL(Dataset是什么、外部数据源、UDF定义和分布式SQL引擎)
Note_Spark_Day08:Spark SQL(Dataset是什么、外部数据源、UDF定义和分布式SQL引擎)
50 0
|
9月前
|
消息中间件 存储 分布式计算
Spark学习---6、SparkStreaming(SparkStreaming概述、入门、Kafka数据源、DStream转换、输出、关闭)(二)
Spark学习---6、SparkStreaming(SparkStreaming概述、入门、Kafka数据源、DStream转换、输出、关闭)(二)
|
9月前
|
消息中间件 分布式计算 Kafka
Spark学习---6、SparkStreaming(SparkStreaming概述、入门、Kafka数据源、DStream转换、输出、关闭)(一)
Spark学习---6、SparkStreaming(SparkStreaming概述、入门、Kafka数据源、DStream转换、输出、关闭)(一)
|
SQL JSON 分布式计算
spark2 sql读取数据源编程学习样例2:函数实现详解
spark2 sql读取数据源编程学习样例2:函数实现详解
70 0
spark2 sql读取数据源编程学习样例2:函数实现详解
|
SQL 分布式计算 Java
spark2 sql读取数据源编程学习样例1
spark2 sql读取数据源编程学习样例1
55 0
spark2 sql读取数据源编程学习样例1
EMR Spark Runtime Filter性能优化 | 7月5号云栖夜读
今天的首篇文章,讲述了:Join是一个非常耗费资源耗费时间的操作,特别是数据量很大的情况下。一般流程上会涉及底层表的扫描/shuffle/Join等过程, 如果我们能够尽可能的在靠近源头上减少参与计算的数据,一方面可以提高查询性能,另一方面也可以减少资源的消耗(网络/IO/CPU等),在同样的资源的情况下可以支撑更多的查询。
3884 0