《数据挖掘:实用案例分析》——导读-阿里云开发者社区

开发者社区> 华章计算机> 正文

《数据挖掘:实用案例分析》——导读

简介:
+关注继续查看


image

前 言

为什么要写这本书

  现在,什么程序员最稀缺?什么技术最火?回答:数据挖掘!

  数据挖掘是从大量数据(包括文本)中挖掘出隐含的、先前未知的、对决策有潜在价值的关系、模式和趋势,并用这些知识和规则建立用于决策支持的模型,提供预测性决策支持的方法、工具和过程。数据挖掘有助于企业发现业务的趋势,揭示已知的事实,预测未知的结果,因此“数据挖掘”已成为企业保持竞争力的必要方法。

  近年来企业所处理的数据每五年就会呈现倍数增长。大部分的企业并没有数据不足的问题,过度的数据重复与不一致才是大问题,这使得企业在使用、有效管理以及将这些数据用于决策过程方面都遭遇到了问题。因此未来几年,随着大数据迅速发展,数据挖掘将是极为重要的成长领域,其应用会越来越广泛,可以说,只要企业掌握有分析价值的数据源,皆可进行高价值的数据挖掘分析。目前数据挖掘主要应用在电信、零售、农业、互联网、金融、电力、生物、化工和医疗等行业。典型的应用如:客户细分、流失预警、价值评估、交叉销售、欺诈发现、精准营销、故障诊断等。

  总的来说,跟国外相比,我国由于信息化程度不太高、企业内部信息不完整,零售业、银行、保险、证券等对数据挖掘的应用并不太理想。但随着市场竞争的加剧,各行业应用数据挖掘技术的意愿越来越强烈,可以预计,未来几年各行业的数据分析应用一定会从传统的统计分析发展到大规模数据挖掘应用。

  本书作者从实践出发,结合大量数据挖掘工程案例,总结出数据挖掘建模过程应完成的任务主要包括:数据探索、数据预处理、分类与回归、聚类分析、时序预测、关联规则挖掘、偏差检测等。因此,本书的编排以解决某个应用的挖掘目标为前提,先介绍案例背景,再阐述分析方法与过程,最后完成模型构建,在介绍建模过程的同时穿插操作训练,把相关的知识点嵌入相应的操作过程中。

  本书光盘中附数据挖掘建模案例数据文件、数据挖掘算法工具包源程序及使用说明。

读者对象

  • 需求分析及系统设计人员。

  这类人员可以在理解数据挖掘原理及建模过程的基础上,结合数据挖掘案例完成精确营销、客户分群、交叉销售、客户流失分析、客户信用记分、欺诈发现等数据挖掘应用的需求分析和设计。

  • 数据挖掘开发人员。

  这类人员可以在理解数据挖掘应用需求和设计方案的基础上,结合本书提供的基于第三方接口快速完成数据挖掘应用的编程实现。

  • 开设有数据挖掘课程的高校教师和学生。

  目前国内不少高校将数据挖掘引入本科教学中,在数学、自动化、电子信息、金融等专业开设了数据挖掘技术相关的课程。目前这一课程的教学仍主要限于理论介绍,因为过于抽象,学生理解起来往往比较困难,教学效果不甚理想。本书提供的基于实战案例和建模实践的教学,能够使师生充分发挥互动性和创造性,理论联系实际,从而获得最佳的教学效果。

  • 进行数据挖掘应用研究的科研人员。

  许多科研院所为了更好地对科研工作进行管理,纷纷开发了适应自身特点的科研业务管理系统,并在使用过程中积累了大量的科研信息数据。但是,这些科研业务管理系统一般没有对这些数据进行深入分析的功能,对数据所隐藏的价值并没有充分挖掘利用。科研人员需要数据挖掘建模工具及有关方法论来深挖科研信息的价值,从而提高科研水平。

  • 关注高级数据分析的人员。

  业务报告和商业智能解决方案对于了解过去和现在的状况是非常有用的。但是,数据挖掘的预测分析解决方案还能使这类人员预见未来的发展状况,让他们的机构能够先发制人,而不是处于被动。因为数据挖掘的预测分析解决方案将复杂的统计方法和机器学习技术应用到数据之中,通过使用预测分析技术来揭示隐藏在交易系统或企业资源计划(ERP)、结构数据库和普通文件中的模式和趋势,从而为这类人员的决策提供科学依据。

  
  张良均

  2013年4月于广州

目 录

[第1章 初识数据挖掘
1.1 什么是数据挖掘](https://yq.aliyun.com/articles/173582/)
1.2 数据挖掘在企业商务智能应用中的定位
1.2.1 数据挖掘给企业带来最大的投资收益
1.2.2 数据挖掘从本质上提升商务智能平台的价值
1.2.3 数据挖掘让商务智能流程真正形成闭环
1.3 信息类BI应用与知识类BI应用
1.4 数据挖掘现状及应用前景
1.5 本章小结
[第2章 数据挖掘的应用分类
2.1 分类与回归](https://yq.aliyun.com/articles/173611/)
2.1.1 分类与回归建模原理
2.1.2 分类与回归算法
2.2 聚类
2.2.1 聚类分析建模原理
2.2.2 聚类算法
2.3 关联规则
2.3.1 什么是关联规则
2.3.2 关联规则算法
2.4 时序模式
2.4.1 什么是时序模式
2.4.2 时间序列的组合成分
2.4.3 时间序列的组合模型
2.4.4 时序算法
2.5 偏差检测
2.6 本章小结
[第3章 数据挖掘建模
3.1 数据挖掘的过程](https://yq.aliyun.com/articles/173683/)
3.2 数据挖掘建模过程
3.2.1 定义挖掘目标
3.2.2 数据取样
3.2.3 数据探索
3.2.4 预处理
3.2.5 模式发现
3.2.6 模型构建
3.2.7 模型评价
3.3 常用的建模工具
3.4 本章小结

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
使用Spring AOP实现MySQL数据库读写分离案例分析
使用Spring AOP实现MySQL数据库读写分离案例分析 前言 分布式环境下数据库的读写分离策略是解决数据库读写性能瓶颈的一个关键解决方案,更是最大限度了提高了应用中读取 (Read)数据的速度和并发量。
1746 0
【理论+案例实战】Python数据分析之逻辑回归(logistic regression)
逻辑回归是分类当中极为常用的手段,它属于概率型非线性回归,分为二分类和多分类的回归模型。对于二分类的logistic回归,因变量y只有“是”和“否”两个取值,记为1和0。假设在自变量x1,x2,……,xp,作用下,y取“是”的概率是p,则取“否”的概率是1-p。
9548 0
PgSQL · 应用案例 · 经营、销售分析系统DB设计之共享充电宝
背景 共享充电宝、共享单车、共享雨伞,共享女朋友^|^,共享汽车,。。。 共享经济最近几年发展确实非常迅猛。 共享必定涉及被共享对象的管理、会员的管理等,实际上也属于一种物联网系统。 本文以共享充电宝的场景为例,分享一下共享充电宝的经营分析、销售管理系统的后台数据库的设计。(老板关心的是整体销售的业绩,以及各个渠道的透视等。销售经理关心的是他管辖片区的销售业绩,运维人员关心的是设备的状态。)
1367 0
【阿里在线技术峰会】罗龙九:云数据库十大经典案例分析
在阿里巴巴在线峰会上的第二天,来自阿里云资深DBA专家罗龙九给大家带来了题为《云数据库十大经典案例分析》的分享。罗龙九以MySQL数据库为例,分析了自RDS成立至今,用户在使用RDS过程中最常见的问题,包括:索引、SQL优化、锁、延迟、参数优化、连接数、CPU、Iops、磁盘、内存等。
10917 0
《数据挖掘:实用案例分析》——1.3 信息类BI应用与知识类BI应用
本节书摘来自华章计算机《数据挖掘:实用案例分析》一书中的第1章,第1.3节,作者 张良均 陈俊德 刘名军 陈荣,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1090 0
《数据挖掘:实用案例分析》——第1章 初识数据挖掘 1.1 什么是数据挖掘
本节书摘来自华章计算机《数据挖掘:实用案例分析》一书中的第1章,第1.1节,作者 张良均 陈俊德 刘名军 陈荣,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1289 0
《数据挖掘:实用案例分析》——第2章 数据挖掘的应用分类 2.1 分类与回归
本节书摘来自华章计算机《数据挖掘:实用案例分析》一书中的第2章,第2.1节,作者 张良均 陈俊德 刘名军 陈荣,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1240 0
《大数据原理:复杂信息的准备、共享和分析》一一2.7 案例:医院登记
本节书摘来自华章出版社《大数据原理:复杂信息的准备、共享和分析》一 书中的第2章,第2.7节,作者:[美] 朱尔斯 J. 伯曼(Jules J. Berman)著 ,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
971 0
使用AppFabric 承载WCF和WF服务-实例分析和说明
针对Pro Windows Server AppFabric ISBN-13 (pbk): 978-1-4302-2817-2图书中的例子进行修改和分析 这个例子的应用场景如下: 前端是Asp.
755 0
10059
文章
0
问答
来源圈子
更多
+ 订阅
文章排行榜
最热
最新
相关电子书
更多
文娱运维技术
立即下载
《SaaS模式云原生数据仓库应用场景实践》
立即下载
《看见新力量:二》电子书
立即下载