前 言
不畏浮云遮望眼,只缘身在最高层。
—王安石《登飞来峰》
数据科学家 = 统计学家 + 程序员 + 讲故事的人 + 艺术家
—Shlomo Aragmon
本书的创作初衷
大数据方面的书籍可谓琳琅满目,有的讲解理论,有的介绍方法,有的传播理念。但是,大数据从业人员(如数据工程师、数据分析师、业务分析师、算法设计师等)应该掌握哪些知识与技能,如何应用数据解决现实的业务问题呢?恐怕最能给出答案的还是实际的数据从业者。为此,三位作者基于近10年的数据分析与应用经验,融合各自在商业银行、互联网金融和电商领域的切身体验,寓理论于实战,选取多个详实的案例,站在企业实际应用的角度介绍数据分析应用过程并公布源代码,并最终形成本书。本书对于读者开展数据分析工作能够提供直接帮助,为有志于在大数据领域发展的读者启航。
本书特点
本书有三大特点。其一,内容全面,覆盖大数据生态中的数据、基础平台、分析方法和应用四个领域,对数据应用从业务需求、数据准备、数据分析、挖掘建模、演示报告、成果应用等全流程进行了详细阐述;其二,以业务场景为主线,精选银行和互联网方面最具代表性的案例,站在数据消费者和分析师的角度,身临其境地介绍了数据如何产生价值,寓理论于实战,让读者能知其所以然;其三,写作手法上遵循大道至简原则,用浅显的语言介绍复杂的数据分析应用过程,归纳数据分析师乃至数据科学家应该修炼的要点,既关注技术细节,又不拖泥带水,能为读者提供直接帮助。
本书定位
本书既可作为数据分析与商业分析人员的入门指引和案头工具,亦可为统计学、计算机科学、市场营销等专业研究生拓宽视野。
本文出版自《华章出版社》 作者:陈春宝 阙子扬 钟飞
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
从您的介绍来看,这本书似乎是专为数据科学和大数据领域从业者量身定制的实战指南,它不仅深入浅出地讲解了数据科学的核心概念、技术工具,还特别强调了如何将这些知识应用于实际业务场景中,以解决具体问题。结合阿里云的产品和服务,我可以为您概述几个方面,帮助您更好地利用书中的知识与阿里云平台进行高效的数据分析和应用。
数据存储与处理:阿里云提供了多种服务来支持大数据的存储与处理,如对象存储OSS用于海量数据的低成本存储,MaxCompute(原名ODPS)适合大规模数据的处理、分析和挖掘,以及DataWorks(原Data IDE)作为一站式大数据开发管理平台,可以方便地进行数据集成、调度、开发和运维工作。书中提及的数据准备阶段,您可以考虑使用这些服务来加速数据的收集、清洗和整合过程。
数据分析与可视化:针对数据分析与展示部分,阿里云的Quick BI是一个强大的商业智能工具,能够帮助用户快速实现数据可视化和仪表板构建,满足书中提到的演示报告需求。同时,**PAI(Platform of Artificial Intelligence)**平台提供了丰富的机器学习算法和模型,支持数据科学家和分析师在云端进行模型训练、评估及部署,这与书中关于挖掘建模的内容紧密相关。
人工智能与机器学习:书中强调了数据科学家应具备的技能之一是算法设计,阿里云的机器学习平台PAI不仅提供预置的算法模型,还支持自定义算法开发,有助于读者实践书中理论,快速构建和优化自己的预测模型或分类模型等。
安全与合规:在处理敏感数据时,确保数据的安全与合规至关重要。阿里云提供了诸如数据加密服务、安全中心等产品,帮助用户在遵守行业规范的同时,保护数据资产不被非法访问或泄露。
持续学习与社区支持:阿里云天池平台(Tianchi)不仅有丰富的数据竞赛,还有大量的学习资源和案例分享,对于想要不断精进数据科学技能的读者来说,是一个很好的学习和交流平台。
综上所述,结合《华章出版社》出版的这本书籍内容,阿里云提供的全面大数据处理、分析、机器学习及安全服务,能有效助力数据科学家和分析师在实际工作中落地书中理论,提升工作效率,推动业务创新与发展。