前 言
大数据这个概念自诞生以来,已经经历了几次飞跃。时至今日,大数据这个名词频繁地与人工智能、DT、预测等词汇放在一起,看上去数据的发展已经成为与科技发展甚至整个社会发展平行的存在——?一切的颠覆都离不开数据。大数据是一种赋能工具,它的作用是帮助行业加速价值的流通,减少信息不对称,提高交易效率。
市面上大数据行业相关的书籍已经汗牛充栋,然而还没有这样一本书——全面地解析大数据、企业和人之间的关系,站在企业管理者的角度解答如何利用大数据加速发展、攫取更多的价值;更没有人全面告诉企业的管理者,如果想转型以适应当今智能数据时代,应该储备何种知识和人才。TalkingData作为大数据行业的领军企业,决定写这样一本书。
竞争环境:行业快速发展,传统行业加速转型
根据IDC的数据显示,到2020年,全球大数据技术和服务市场预计将达到589亿美元,其中大数据基础设施占277亿美元,大数据软件占159亿美元,大数据服务占(包括专业和支持服务)153亿美元。相比于北美等发达地区,中国大数据产业虽然年轻,但是处于快速发展期。根据DT大数据产业创新研究院(DTiii)的预测,从现在到2025年,大数据产业的经济总量将呈指数级增长(如下图),覆盖的行业包括政府、金融、电信、交通、工业、能源、房地产、教育、商业服务、医疗、文娱、农业等。
目 录
第一篇 大数据基础知识
第1章 大数据的基本定义
1.1 大数据分析的出现
1.2 大数据如何发掘价值
1.3 大数据处理的关键——数据类型
1.4 大数据处理的微妙之处
1.5 大数据环境下的处理分析工具
1.6 智能数据时代到来
第2章 数据的艺术
2.1 评估可能性的艺术
2.2 了解现状
2.3 自我评估、完善度、信息架构
2.4 愿景部署
2.5 现在和将来的数据仓库
2.6 实时建议和操作
2.7 验证提出的愿景
第3章 大数据:有所为有所不为
3.1 大数据分析最佳实践
3.2 从小做起
3.3 关注大局
3.4 避免最差实践
3.5 步步为营
3.6 学会利用异常数据
3.7 速度与精度的抉择
3.8 内存计算
第二篇 大数据工具和技术
第4章 分布式世界中的设计
4.1 可见性
4.2 保持简单的重要性
4.3 组合
4.4 分布式状态
4.5 CAP原则
4.6 松耦合系统
4.7 速度
4.8 总结
第5章 大数据分析工具
5.1 Apache Hadoop
5.2 Apache Spark
5.3 NoSQL数据库
5.4 MongoDB