大公司都在做的大数据平台,为你精选这一份书单

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 现如今每个公司都有自己的大数据平台和大数据团队,可以看出大数据建设在公司的重要地位,不管是用于做数据分析、BI还是做用于机器学习、人工智能等领域,大数据都是基础,海量数据成为了互联网公司的重要资产。

现如今每个公司都有自己的大数据平台和大数据团队,可以看出大数据建设在公司的重要地位,不管是用于做数据分析、BI还是做用于机器学习、人工智能等领域,大数据都是基础,海量数据成为了互联网公司的重要资产。

今天这一份书单,我们将推荐几本综合介绍大数据平台和技术栈的优质书籍,帮各位对大数据技术感兴趣的小伙伴快速入门和学习大数据。

大数据技术栈系列书单

大数据技术原理与应用

(1) 概念篇:介绍当前紧密关联的*新IT领域技术云计算、大数据和物联网。
(2) 大数据存储与管理篇:介绍分布式数据存储的概念、原理和技术,包括HDFS、HBase、NoSQL数据库、云数据库。
(3) 大数据处理与分析篇:介绍MapReduce分布式编程框架、基于内存的分布式计算框架Spark、图计算、流计算、数据可视化。
(4) 大数据应用篇:介绍基于大数据技术的推荐系统。

作者简介

林子雨,北大博士,厦门大学计算机科学系老师,中国高校**"数字教师"的提出者和建设者。在数据库、数据仓库、数据挖掘、大数据、云计算和物联网等领域有着十多年的知识积累,对各个领域知识都有比较深入的了解,有比较宽泛的视野。

大数据平台基础架构指南

当前不乏大数据具体技术组件的书籍,但却很少有从大数据平台整体建设和产品形态的宏观角度入手来阐释的。

本书重点介绍大数据开发平台服务构建的整体思路和解决方案,内容涵盖一个成熟的大数据开发平台必不可少的各类核心组件:工作流调度系统、集成开发环境、元数据管理系统、数据交换服务、数据可视化服务、数据质量管理服务,以及测试环境的建设等。

书中还凝结了作者多年平台建设的实践经验,以及对大数据相关从业人员能力建设和职业规划的宝贵建议。本书适合广大志在深入了解大数据平台建设、开发和应用的在职人员及院校师生。

作者简介

刘旭晖,花名天火,蘑菇街数据平台资深架构师,负责蘑菇街大数据服务平台整体产品规划和架构设计工作;此前多年供职于Intel开源技术中心,是Spark/Hadoop/HBase/Phoenix等开源项目贡献者;在内核驱动、操作系统中间件、输入法、浏览器等方向均有多年开发经验。

大数据架构详解:从数据获取到深度学习

本书从架构、业务、技术三个维度深入浅出地介绍了大数据处理领域端到端的知识。主要内容包括三部分:第一部分从数据的产生、采集、计算、存储、消费端到端的角度介绍大数据技术的起源、发展、关键技术点和未来趋势,结合生动的业界新产品,以及学术界新的研究方向和成果,让深奥的技术浅显易懂;第二部分从业务和技术角度介绍实际案例,让读者理解大数据的用途及技术的本质;第三部分介绍大数据技术不是孤立的,讲解如何与前沿的云技术、深度学习、机器学习等相结合。

作者简介

朱洁,2008年加入华为,具有8年大数据研发管理经验,现任华为大数据服务首席规划师。专注于大数据服务平台建设、规划和实践应用,同时参与多项企业级大数据项目解决方案的规划、设计和实施工作,在深化大数据行业落地方面有诸多实践经验,对解读大数据垂直行业的技术创新与开发有诸多独到的见解和心得。

罗华霖,2002年加入华为,华为大数据首席规划师,主导完成华为大数据平台DataSight和华为电信大数据解决方案SmartCare技术规划和架构设计,支持电信运营商数字化战略转型,完成浙江移动、上海联通、沙特STC等200+电信大数据解决方案项目落地。曾任华为软交换首席设计师,华为大型电信大数据解决方案SmartCare首席架构师。

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
前端开发 数据可视化 JavaScript
前端图形学实战: 从零开发一款轻量级滑动验证码组件(vue3 + vite版)
前端图形学实战: 从零开发一款轻量级滑动验证码组件(vue3 + vite版)
1214 0
|
消息中间件 数据采集 缓存
性能调优篇:困扰我半年之久的RocketMQ timeout exception 终于被破解了
性能调优篇:困扰我半年之久的RocketMQ timeout exception 终于被破解了
性能调优篇:困扰我半年之久的RocketMQ timeout exception 终于被破解了
|
存储 SQL 分布式计算
Fusion Insight大数据平台介绍
1. 概述 华为Fusion Insight是一个分布式数据处理系统,对外提供大容量的数据存储、查询和分析能力。Fusion Insight在Hadoop集群上又封装了一层,类似于开源的CDH,HDP等大数据平台。
5567 0
|
缓存 弹性计算 负载均衡
中间件硬件性能不足
解决中间件硬件性能不足的问题需要从多个方面入手,包括升级硬件设备、优化资源配置、引入负载均衡机制、优化中间件配置、使用数据缓存技术以及进行实时监测与调优等。这些措施可以有效提升中间件的硬件性能,提高整个应用系统的性能和稳定性。
213 5
|
JavaScript
|
SQL 关系型数据库 MySQL
使用python连接MySQL数据库,进行增删改查,实现步骤
在Python中连接MySQL数据库并进行增删改查操作,我们需要使用一个库叫做pymysql。
423 4
|
JSON 虚拟化 Docker
Windows10 Docker安装和docker-compose 安装
Windows10 Docker安装和docker-compose 安装
1314 0
|
IDE 编译器 Linux
你应该搞懂的 C 语言头文件路径问题
聊聊系统路径位置,绝对路径与相对路径,正斜杠 `/` 与 反斜杠 `\` 使用说明 ...... by 矜辰所致
583 0
你应该搞懂的 C 语言头文件路径问题
|
大数据 数据挖掘 Java
大数据平台开发规范示例
大数据平台开发规范示例
499 0
大数据平台开发规范示例
|
弹性计算 网络安全 数据中心
阿里云专有网络RFC私网地址172、10和196网段选择攻略
2023阿里云专有网络RFC私网地址172、10和196网段选择攻略,阿里云专有网络VPC私网网段可选192.168.0.0/16、172.16.0.0/12或10.0.0.0/8,如何选择?阿里云百科来详细说下阿里云专有网络IPv4网段选择方法:
1704 0
阿里云专有网络RFC私网地址172、10和196网段选择攻略
下一篇
开通oss服务