15篇大数据精品文章大合集

本文涉及的产品
阿里云百炼推荐规格 ADB PostgreSQL,4核16GB 100GB 1个月
实时计算 Flink 版,5000CU*H 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 这一次,开发者社区为正在“宅家办公”的小伙伴们献上福利~这次的合集整理了一些比较受开发者欢迎的关于大数据技术领域的优质文章。

这一次,开发者社区为正在“宅家办公”的小伙伴们献上福利~这次的合集整理了一些比较受开发者欢迎的关于大数据技术领域的优质文章。

不管是初涉该领域,还是已经有一定了解,相信都能从文章中获益。大家快来学习吧~

1. 数据工程师必须掌握的7个大数据实战项目

查看原文

  • 值得收藏,数据工程师必须掌握的7个大数据实战项目

2. 阿里云大数据+AI技术沙龙上海站回顾 | ​揭秘TPC-DS 榜单第一名背后的强大引擎

查看原文

  • 11月16日的大数据+AI沙龙上海站取得圆满成功! EMR 团队在国内运营最大的 Spark 社区,为了更好地传播和分享业界最新技术和最佳实践,现在联合开源社区同行,打造一个纯粹的技术交流线下沙龙《大数据 + AI》,定期为大家做公益分享。本次分享,揭秘TPC-DS 榜单第一名背后的强大引擎,探索Pyboot如何打通大数据生态,一同学习业内最新的存储方案和机器学习平台。

3. 数字化与数据中台的价值思考——徐季秋

查看原文

  • 数据中台是指通过数据技术,对海量数据进行采集、计算、存储、加工,同时统一标准和口径。数据中台把数据统一之后,会形成标准数据,再进行存储,形成大数据资产层,进而为客户提供高效服务。 狭义的数据中台单指数据技术,比如对海量数据进行采集、计算、存储、加工的一系列技术集合,时下我们谈到的数据中台还包括数据模型,算法服务,数据产品,数据管理以及方法论。 本篇主要从传统企业数字化转型的角度,浅析了数字中台的价值。

4. 【精品问答】大数据计算技术1000问

查看原文

  • 开发者社区策划了大数据计算技术1000问内容,包含Flink、Spark等流式计算(实时计算)、离线计算、Hbase等实践中遇到的技术问题和面试问题等维度内容。

5. 如何分析及处理 Flink 反压?

查看原文

  • 反压(backpressure)是实时计算应用开发中,特别是流式计算中,十分常见的问题。反压意味着数据管道中某个节点成为瓶颈,处理速率跟不上上游发送数据的速率,而需要对上游进行限速。

6. 开放下载!《阿里巴巴大数据及AI实战》深度解析典型场景大数据实践

查看原文

  • 深度剖析淘宝、高德、友盟+、1688、优酷、阿里妈妈、阿里影业大数据实战场景,2020不容错过的企业大数据实战手册。

7. 独家下载 |《大数据工程师必读手册》揭秘阿里如何玩转大数据

查看原文

  • 阿里巴巴如何玩转大数据?十位阿里巴巴大数据专家深度分析 ,飞天大数据平台八款产品最新玩法,2019不容错过的大数据手册——《大数据工程师必读手册》现在可以免费下载阅读啦,赶紧先睹为快吧。

8. 独家下载 |《大数据工程师必读手册》揭秘阿里如何玩转大数据

查看原文

  • 阿里巴巴如何玩转大数据?十位阿里巴巴大数据专家深度分析 ,飞天大数据平台八款产品最新玩法,2019不容错

9. 带你读《Apache Kylin权威指南》之一:Apache Kylin概述

查看原文

  • 从最早使用大数据技术来做批量处理,到现在越来越多的人要求大数据平台也能够如传统数据仓库技术一样支持交互式分析,随着数据量的不断膨胀、数据平民化的不断推进,低延迟、高并发地在Hadoop之上提供标准SQL查询能力成为必须攻破的技术难题。而Apache Kylin的诞生正是基于这个背景,并成功地完成了很多人认为不可能实现的突破。

10. 带你读《Apache Kylin权威指南》之二:快速入门

查看原文

  • 本章介绍了使用Apache Kylin前必须了解的基本概念,如星形数据模型、事实表、维表、维度、度量等,并在了解这些基本概念的基础上快速创建了基于Sample Data的模型,构建Cube,最后执行SQL查询。带领读者体验了Apache Kylin的主要使用过程。

11. 带你读《Apache Kylin权威指南》之三:Cube优化

查看原文

  • 本章从多个角度介绍了Cube的优化方法:从Cuboid剪枝的角度、从并发粒度控制的角度、从Rowkey设计的角度,还有从度量精度选择的角度。总的来说,Cube优化需要Cube管理员对Kylin有较为深刻的理解和认识,这也无形中提高了使用和管理Kylin的门槛。

12. 贾扬清谈大数据&AI发展的新挑战和新机遇

查看原文

  • 2019云栖大会大数据&AI专场,阿里巴巴高级研究员贾扬清为我们带来《大数据AI发展的新机遇和新挑战》的分享。本文主要从人工智能的概念开始讲起,谈及了深度学习的发展和模型训练,以及数据的爆发增长,着重阐述了算法、数据和算力的闭环。

13. 大数据团队从0到1

查看原文

  • “大数据”这个词,大家都已经不陌生了,已经从一个新兴的词汇变成了一个百姓茶余饭后都会聊到的概念。各种大大小小的互联网公司也都会创建自己的大数据团队,我也曾经在多家公司从事过大数据领域的开发和团队管理工作,这里写一下我自己的经历和感受。

14. 详解阿里云数据中台,一篇文章全面了解大数据“网红”

查看原文

  • 一直想写一篇关于数据中台正面文章,现在有闲时做些总结,想充分诠释一下DT内部人如何看待数据中台。 数据中台的概念是最早由阿里巴巴首次提出,是为了应对内部众多业务部门千变万化的数据需求和高速时效性的要求而成长起来的,它既要满足业务部门日常性的多个业务前台的数据需求,又要满足像双十一,六一八这样的业务高峰、应对大规模数据的线性可扩展问题、应对复杂活动场景业务系统的解耦问题,而在技术、组织架构等方面采取的一些变革。

15. 大数据人才培养经验分享

查看原文

  • 总结了一下过去5年在各个高校进行大数据人才培养的经验。
相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
存储 消息中间件 分布式计算
大数据简介
大数据简介
230 0
|
传感器 大数据
大数据的学习笔记第一次学习
大数据的学习笔记 (一)
|
存储 SQL 分布式计算
大数据入门-大数据技术概述(一)
大数据入门-大数据技术概述(一)
648 1
大数据入门-大数据技术概述(一)
|
SQL 消息中间件 分布式计算
大数据入门-大数据技术概述(二)
大数据入门-大数据技术概述(二)
190 0
大数据入门-大数据技术概述(二)
|
存储 传感器 运维
大数据入门-大数据是什么
大数据入门-大数据是什么
171 0
大数据入门-大数据是什么
|
存储 分布式计算 资源调度
【大数据】入门知识介绍
【大数据】入门知识介绍
357 0
|
存储 分布式计算 大数据
图解大数据 | 大数据生态与应用导论
随着互联网高速发展,网络数据呈现出指数级别的快速增长,针对海量数据处理的大数据解决方案应运而生。ShowMeAI将在接下来的内容中逐步展开讲解大数据生态工具的应用,以及大数据的处理分析挖掘方法。
218 0
图解大数据 | 大数据生态与应用导论
|
SQL 分布式计算 监控
入门学习大数据
对于上云课程中的云小宝入门学习大数据
181 0
入门学习大数据
|
SQL 弹性计算 运维
学习大数据入门
冬季实战营第五期:轻松入门学习大数据
135 0
|
SQL 分布式计算 运维
轻松入门学习大数据
基于EMR离线数据分析,使用阿里云Elasticsearch快速搭建智能运维系统,推荐系统入门之使用协同过滤实现商品推荐
下一篇
无影云桌面