数据挖掘任务类型

简介: 数据挖掘任务类型

引言

在大数据时代我们总有许许多的的数据要去挖掘分析。


问题描述

那么数据挖掘任务有哪些类型呢?我们该如何去判断进而去处理它呢?

方法

我们要认识到有以下四种类型:

1.预测建模(predictive modeling)

涉及以说明变量函数的方式为目标变量建立模型。有两类预测建模任务:分类(classification),用于预测离散的目标变量;回归(regression),用于预测连续目标变量。

例如:对一个地区的近几年各月份降雨量做统计,对其建模分析预测未来几年的降雨量,从而进行一些事情的开展。

2.关联分析(association analysis)

用来发现描述数据中强关联特征的模式。所发现的模式通常蕴含规则或特征子集的形式表示。(由于搜索空间是指数规模的,关联分析的目标是以有效的方式提取最有趣的模式。)

例如:对顾客购物篮所装物品的分析。对顾客的购物习惯进行分析,可以针对进行商品营销策略。最经典的就是啤酒与尿布的故事。

3.异常检测(anomaly detection)

是识别其特征显著不懂与其他数据的观测值。这样的观测值称为异常点(anomaly)或离群点(outlier)。异常检测算法的目标时发现真正的异常点,

而避免错误地将正常的对象标注为异常点。

例如:对于地震波的检测就属于异常点检测。

4.聚类分析(cluster analysis

旨在发现紧密相关的观测值组群,使得与属于不同簇的观测值相比,属于同一簇的观测值相互之间尽可能类似。

例如:对于多个单位的不同属性分析时就可以对相同的属性进行。

最简单的就是对去年我国不同城市的消费能力的分析。


结语

在这个数据复杂的时代我们可以掌握更多的技能,正所谓技多不压身嘛!

目录
相关文章
|
6月前
|
运维 安全 数据挖掘
【数据挖掘】离群点概念、类型、检测的挑战概述(图文解释 超详细)
【数据挖掘】离群点概念、类型、检测的挑战概述(图文解释 超详细)
423 0
|
6月前
|
数据采集 安全 数据挖掘
【数据挖掘】属性及其类型和数据的统计描述四分位数等详解(图文解释 超详细)
【数据挖掘】属性及其类型和数据的统计描述四分位数等详解(图文解释 超详细)
462 0
|
数据可视化 数据挖掘 数据库
【数据挖掘】用Excel挖掘股权关系并按照年份统计不同类型的亲缘关系在上市公司中的分布和趋势【动态可视化工具】
推荐一个在线制作动图网站 Flourish(https://app.flourish.studio) 无需编程基础就可以做出漂亮的动态图表🎉🎉🎉
245 1
【数据挖掘】用Excel挖掘股权关系并按照年份统计不同类型的亲缘关系在上市公司中的分布和趋势【动态可视化工具】
|
机器学习/深度学习 数据采集 算法
【数据挖掘】分类任务简介 ( 分类概念 | 分类和预测 | 分类过程 | 训练集 | 测试集 | 数据预处理 | 有监督学习 )
【数据挖掘】分类任务简介 ( 分类概念 | 分类和预测 | 分类过程 | 训练集 | 测试集 | 数据预处理 | 有监督学习 )
841 0
|
机器学习/深度学习 存储 运维
【数据挖掘】数据挖掘算法 组件化思想 ( 模型或模式结构 | 数据挖掘任务 | 评分函数 | 搜索和优化算法 | 数据管理策略 )
【数据挖掘】数据挖掘算法 组件化思想 ( 模型或模式结构 | 数据挖掘任务 | 评分函数 | 搜索和优化算法 | 数据管理策略 )
532 0
|
分布式计算 算法 数据挖掘
Spark 数据挖掘 - 利用决策树预测森林覆盖类型
Spark 数据挖掘 利用决策树预测森林覆盖类型
2110 0

热门文章

最新文章

下一篇
无影云桌面