《数据科学与大数据分析——数据的发现 分析 可视化与表示》一导读

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 本书将介绍大数据分析中从业人员常用的一些关键技术和分析方法。通过掌握这些常用的大数据分析方法,将帮助您胜任大数据分析项目。书中内容会让不同的读者群体受益:业务和数据分析师通过阅读本书,可以学习到很多实用的大数据分析方法;数据库从业人员、商业智能经理、分析师和大数据从业者通过阅读本书可以丰富数据分析技能,大学毕业生通过阅读本书可以了解如何将数据科学做为职业发展领域。


9830b90c3c65ec8da8472bdc4e98f391919c0b5b

前 言

数据科学与大数据分析——数据的发现 分析 可视化与表示
大数据可以帮助企业从他们最宝贵的信息资产中挖掘到新的商机,从而创造出新的价值并形成竞争优势。对于企业用户而言,大数据可以帮助提高生产效率、提升产品质量和提供个性化的产品和服务,从而帮助改进客户满意度并提升企业利润率。对于学术界而言,大数据分析提供了一种更加先进的分析手段,可以帮助获取更丰富的分析成果和更深入的洞察力。在许多情况下,大数据分析集合了结构化和非结构化数据的实时获取和查询,开拓了创新和洞察的新路径。

本书将介绍大数据分析中从业人员常用的一些关键技术和分析方法。通过掌握这些常用的大数据分析方法,将帮助您胜任大数据分析项目。书中内容会让不同的读者群体受益:业务和数据分析师通过阅读本书,可以学习到很多实用的大数据分析方法;数据库从业人员、商业智能经理、分析师和大数据从业者通过阅读本书可以丰富数据分析技能,大学毕业生通过阅读本书可以了解如何将数据科学做为职业发展领域。

本书包括12章。第1章主要向读者介绍大数据领域、高级数据分析的驱动力和数据科学家的角色作用。

第2章主要介绍根据假设驱动(Hypothesis-driven)的大数据分析的特点和挑战所设计的项目生命周期。

第3章将在开源R分析软件环境下探讨基础的统计方法和技术,此外还将介绍通过数据可视化进行探索性分析的重要性,并回顾基于假设的开发和测试等关键概念。

第4~9章主要介绍一系列先进的数据分析方法,包括:聚类、分类、回归分析、时间序列和文本分析。

第10~11章讲解支持大数据高级分析功能的几种特定技术和工具,特别是MapReduce和它在Hadoop生态系统中的应用实例,以及对SQL和数据库内建文本分析功能的深入讲解。

第12章将指导如何运作大数据分析项目。本章将重点讲解如何将一个分析项目转换成组织运作的资产,如何基于数据创建清晰有用的可视分析结果,完成最终的交付工作。

目 录

第1章 大数据分析介绍
1.1 大数据概述
1.2 分析的实践状态
1.3 新的大数据生态系统中的关键角色
1.4 大数据分析案例
1.5 总结
1.6 练习
第2章 数据分析生命周期
2.1 数据分析生命周期概述
2.2 第1阶段:发现
2.3 第2阶段:数据准备
2.4 第3阶段:模型规划
2.5 第4阶段:模型建立
2.6 第5阶段:沟通结果
2.7 第6阶段:实施
2.8 案例研究:全球创新网络和分析(GINA)
2.9 总结
2.10 练习
第3章 使用R进行基本数据分析
第4章 高级分析理论与方法:聚类
第5章 高级分析理论与方法:关联规则
第6章 高级分析理论与方法:回归
第7章 高级分析理论与方法:分类
第8章 高级分析理论与方法:时间序列分析
第9章 高级分析理论与方法:文本分析
第10章 高级分析技术与工具:MapReduce和Hadoop
第11章 高级分析技术与工具:数据库内分析
第12章 结尾

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
2月前
|
机器学习/深度学习 并行计算 数据挖掘
R语言是一种强大的统计分析工具,广泛应用于数据分析和机器学习领域
【10月更文挑战第21天】R语言是一种强大的统计分析工具,广泛应用于数据分析和机器学习领域。本文将介绍R语言中的一些高级编程技巧,包括函数式编程、向量化运算、字符串处理、循环和条件语句、异常处理和性能优化等方面,以帮助读者更好地掌握R语言的编程技巧,提高数据分析的效率。
61 2
|
7月前
|
机器学习/深度学习 算法 数据挖掘
数据分析入门系列教程-股票走势预测分析
数据分析入门系列教程-股票走势预测分析
117 0
数据分析入门系列教程-股票走势预测分析
|
数据采集 机器学习/深度学习 搜索推荐
数据分析与数据挖掘
数据分析与数据挖掘是两个密切相关但又有区别的概念。 数据分析是指通过收集、处理、分析数据,提取有价值的信息,以便更好地理解数据背后的业务情况和趋势,为决策提供支持。数据分析通常包括描述性统计、探索性数据分析、验证性数据分析和预测性数据分析等步骤。数据分析的应用场景包括:用户行为分析、市场趋势分析、产品性能分析等。
161 8
|
7月前
|
数据采集 搜索推荐 数据可视化
Day04-数据分析模型
Day04-数据分析模型
|
存储 数据可视化 算法
数据分析案例-气象数据分析
数据分析案例-气象数据分析
347 0
数据分析案例-气象数据分析
|
数据采集 分布式计算 数据可视化
数据分析学习
个人学习
211 0
数据分析学习
|
机器学习/深度学习 算法 数据挖掘
做数据分析,要懂多少模型
一提起数据分析,很多人都会联想到“分析模型”,似乎分析模型是个很厉害又很神秘的东西。那做数据分析到底需要懂多少模型?今天简单跟大家分享一下。
220 0
做数据分析,要懂多少模型
|
机器学习/深度学习 SQL 自然语言处理
数据挖掘与数据分析
数据挖掘与数据分析
334 0
|
JSON JavaScript 前端开发
数据科学的原理与技巧 五、探索性数据分析
五、探索性数据分析 原文:DS-100/textbook/notebooks/ch05 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 探索性数据分析是一种态度,一种灵活的状态,一种寻找那些我们认为不存在和存在的东西的心愿。
1088 0
|
人工智能 物联网 数据挖掘
非数据科学家如何进行数据分析?
文章讲的是非数据科学家如何进行数据分析,Gartner报告称,到2018年,大多数业务人员和分析师都将通过自助式BI工具来准备和分析大数据。虽然目前国内的发展现状无法在2018年达到自助式分析的局面,但这一趋势无法否认。
1244 0