《数据分析变革:大数据时代精准决策之道》一2.4 小结

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介:

本节书摘来自异步社区《数据分析变革:大数据时代精准决策之道》一书中的第2章,第2.4节,作者【美】Bill Franks(比尔•弗兰克斯),更多章节内容可以访问云栖社区“异步社区”公众号查看

2.4 小结

从本章中我们获得的最重要的启发有以下几个。

  • 不必管该如何定义大数据。我们要管的是哪些数据,无论大小,是分析需要的。定义不重要,结果才重要!
  • 我们要保持业务问题导向。不要为了实现大数据技术而实现大数据。
  • 尽管过度炒作和不切实际的短期预期确实存在,但大数据时代切切实实已然到来。就像因特网泡沫的存在并不能表明因特网不是巨大的商业机会一样,大数据泡沫的存在同样也不意味着大数据就没有巨大的商业机会。
  • 数据让人兴奋的原因是它能提供新的信息。新信息几乎每一次都能打败新算法。
  • 我们不能只使用大数据来完善既有的分析流程。我们还要发现如何利用大数据以全新视角解决老问题或者解决全新问题的方法。
  • 可以预料,在接下来的几年,物联网的炒作肯定会暴涨,但我们一定要重新思考数据留存策略,这样才能应对低价值数据造成的新的数据洪水。
  • 与传统数据相比,大数据的“差异性”会产生比“大数据量”更多的挑战。
  • 大数据需要的不只是数据处理与数据存储的可扩展性。在用户数、并发度、负载管理以及安全性等方面同样需要可扩展性。
  • 大数据一定会是整体数据与分析策略的一个组成部分。大数据肯定不能光靠本身就有效解决所有的问题。
  • 关于 SQL 将亡的预测已经存在许多年了,现在非关系型平台正在争分夺秒地实现 SQL 接口。尽管这也代表了巨大的转变,但它同样也反映了现实的业务需求。
  • 今天,大数据看上去很有颠覆性,大数据现在正在经历与其他数据源相同的成熟度曲线。大数据难以应对,关键在于数据源是同时倾覆而来。
  • 全球各行各业中,多数企业都认为自己落后于大数据时代。事实上,只有少数企业走在前列,这同样也说明,只有少数企业落在队后。

[1]  基于2014年6月12日我为国际分析研究所写的题为“What’s the Definition of Big Data? Who Cares?”的博客。参见http://iianalytics.com/2012/06/whats-the-definition-big-data-who-cares/

[2] 参见www.gartner.com/it-glossary/big-data/的“Gartner IT Glossary”。还请参考2013年5月27日Svetlana Sicular在《福布斯》上发表的“Gartner’s Big Data Definition Consists of Three Parts, Not to Be Confused with Three ‘V’s”,网址是www.forbes.com/sites/gartnergroup/2013/03/27/gartners-big-data-definition-consists-of-three-partsnot-to-be-confused-with-three-vs/。

[3] 参见2012年8月2日我在《IT Briefcase》上发表的“Defi ning Big Data: The Missing ‘V’”,网址是www.itbriefcase.net/defining-big-data-the-missing-v。

[4] 基于2012年12月12日我为国际分析研究所写的题为“Will the Big Data Bubble Burst in 2013?”的博客。参见http://iianalytics.com/2012/12/will-the-big-data-bubble-burst-in-2013/

[5] 参见2013年1月22日Svetlana Sicular在《福布斯》上发表的“Big Data Is Falling into the Trough of Disillusionment”,网址是http://blogs.gartner.com/svetlana-sicular/bigdata-is-falling-into-the-trough-of-disillusionment/

[6] 参见Bill Franks的《Taming the Big Data Tidal Wave》(Hoboken, NJ: John Wiley & Sons, 2012) 。

[7] 基于2013年1月11日我为国际分析研究所写的题为“Driving Analytic Value from New Data”的博客。参见http://iianalytics.com/2013/01/driving-analytic-value-from-new-data/。该主题也在我的《驾驭大数据》一书中有所讨论。

[8] 基于2013年1月14日我为国际分析研究所写的题为“Think Differently to Maximize Value from Big Data Analytics”的博客。参见http://iianalytics.com/2013/03/think-differently-to-maximize-value-from-bigdata-analytics/

[9] Jeff Tanner的《Dynamic Customer Strategy: Big Profits from Big Data》(Hoboken, NJ: John Wiley & Sons, 2014)

[10] 参见2010年8月10日www.drugrecalls.com/celebrex.html的“Pfizer Study Finds that Celebrex May Increase the Risk of Heart Attack”。

[11] 基于2012年8月9日我为国际分析研究所写的题为“A Strategic Mistake with Big Data”的博客。参见http://iianalytics.com/2012/08/a-strategic-mistake-with-big-data/。该主题也在我的《驾驭大数据》一书中有所讨论。

[12] Lisa Arthur的《Big Data Marketing: Engage Your Customers More Effectively and Drive Value》(Hoboken, NJ: John Wiley & Sons, 2013)。

[13] 基于2013年7月11日我为国际分析研究所写的题为“Big Data Analytics Doesn’t Have to Be the Wild West”的博客。参见http://iianalytics.com/2013/07/big-data-analytics-doesnt-have-to-be-the-wild-west/

[14] 基于2013年2月14日我为国际分析研究所写的题为“The Global Nature of Big Data and Analytics”的博客。参见http://iianalytics.com/2013/02/the-global-nature-of-big-data-and-analytics/

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
4月前
|
机器学习/深度学习 数据采集 数据可视化
数据分析在决策过程中的关键步骤有哪些?
【5月更文挑战第17天】数据分析在决策过程中的关键步骤有哪些?
43 1
|
4月前
|
机器学习/深度学习 数据采集 算法
Python用逻辑回归、决策树、SVM、XGBoost 算法机器学习预测用户信贷行为数据分析报告
Python用逻辑回归、决策树、SVM、XGBoost 算法机器学习预测用户信贷行为数据分析报告
|
1月前
|
存储 数据采集 监控
实时数据分析在业务决策中的应用:赋能智慧决策的新篇章
【8月更文挑战第3天】实时数据分析正以其独特的优势在业务决策中发挥越来越重要的作用。通过快速响应市场变化、精准捕捉用户需求、优化运营管理等方式,实时数据分析不仅提高了企业的决策效率和准确性,还为企业带来了显著的商业价值。未来,随着技术的不断进步和应用场景的不断拓展,实时数据分析将在更多领域发挥重要作用,为企业的数字化转型和智慧决策提供更加坚实的支撑。
|
2月前
|
机器学习/深度学习 数据挖掘 大数据
大数据时代的“淘金术”:Python数据分析+深度学习框架实战指南
【7月更文挑战第30天】大数据时代视数据为新石油,Python因强大处理能力成为首选工具。通过NumPy、Pandas等库,Python构建了高效数据分析生态。深度学习框架如TensorFlow和PyTorch支持复杂模型构建。Python与深度学习结合,实现数据清洗、特征工程到模型训练全流程,为企业决策提供强有力支持。掌握这些技能如同掌握“淘金术”,开启无限可能。
92 5
|
1月前
|
机器学习/深度学习 数据采集 人工智能
🔍深度揭秘!AI Prompt如何重塑商业数据分析,让决策快人一步
【8月更文挑战第1天】在数字化转型中,商业数据分析至关重要。AI Prompt技术作为智能分析的催化剂,通过自然语言指令高效处理大规模数据,挖掘深层信息,加速精准决策。基于深度学习等技术,分析师仅需简单Prompt即可自动完成从数据清洗到生成决策建议的全过程。例如,零售业可通过此技术快速分析销售数据,优化商品陈列。AI Prompt简化流程,降低门槛,使企业能迅速响应市场变化,有望成为商业分析的标准工具,引领高效决策的新时代。
34 2
|
2月前
|
机器学习/深度学习 数据采集 数据挖掘
智能决策新引擎:Python+Scikit-learn,打造高效数据分析与机器学习解决方案!
【7月更文挑战第26天】在数据驱动时代,企业需从大数据中提取价值以精准决策。Python凭借丰富的库成为数据分析利器,而Scikit-learn作为核心工具备受青睐。本文通过电商案例展示如何预测潜在买家以实施精准营销。首先进行数据预处理,包括清洗、特征选择与转换;接着采用逻辑回归模型进行训练与预测;最后评估模型并优化。此方案显著提升了营销效率和企业决策能力,预示着智能决策系统的广阔前景。
50 2
|
2月前
|
数据可视化 数据挖掘 Java
深度挖掘数据,智慧决策,VeryReport报表软件引领数据分析新潮流
深度挖掘数据,智慧决策,VeryReport报表软件引领数据分析新潮流
|
2月前
|
机器学习/深度学习 算法 数据挖掘
Python强化学习应用于数据分析决策策略:** - 强化学习让智能体通过环境互动学习决策。
【7月更文挑战第5天】**Python强化学习应用于数据分析决策策略:** - 强化学习让智能体通过环境互动学习决策。 - Python因丰富库(如TensorFlow, PyTorch, Keras, Pandas, NumPy)和生态而受青睐。 - 使用OpenAI Gym构建环境,如`gym.make('CartPole-v0')`。 - 选择模型,例如神经网络,定义策略如Q-Learning。 - 训练模型,调整智能体行为,如Q-Learning更新Q表。 - 最后评估模型性能,实现数据驱动决策。
37 3
|
2月前
|
监控 数据可视化 数据挖掘
ERP系统中的数据分析与决策支持解析
【7月更文挑战第25天】 ERP系统中的数据分析与决策支持解析
78 0
|
2月前
|
数据挖掘 数据处理 决策智能
Python 数据分析工具箱:深挖 Pandas 与 NumPy 高级功能,驱动智能决策
【7月更文挑战第12天】Python的Pandas和NumPy是数据分析的基石。Pandas提供灵活的数据结构如DataFrame,用于高效处理关系型数据,而NumPy则以多维数组和科学计算功能著称。两者结合,支持数据合并(如`pd.merge`)、时间序列分析(`pd.to_datetime`)和高级数组运算。通过掌握它们的高级特性,能提升数据分析效率,应用于各领域,如金融风险评估、市场分析和医疗预测,助力数据驱动的决策。学习和熟练运用Pandas与NumPy是成为出色数据分析师的关键。
36 0

热门文章

最新文章

下一篇
DDNS