《BI那点儿事》数据挖掘各类算法——准确性验证

简介: 原文:《BI那点儿事》数据挖掘各类算法——准确性验证准确性验证示例1:——基于三国志11数据库 数据准备: 挖掘模型:依次为:Naive Bayes 算法、聚类分析算法、决策树算法、神经网络算法、逻辑回归算法、关联算法提升图: 依次排名为: 1.
原文: 《BI那点儿事》数据挖掘各类算法——准确性验证

准确性验证示例1:——基于三国志11数据库

数据准备:

挖掘模型:
依次为:Naive Bayes 算法、聚类分析算法、决策树算法、神经网络算法、逻辑回归算法、关联算法

提升图:

依次排名为:
1. 神经网络算法(92.69% 0.99)
2. 逻辑回归算法(92.39% 0.99)
3. 决策树算法(91.19% 0.98)
4. 关联算法(90.60% 0.98)
5. 聚类分析算法(89.25% 0.96)
6. Naive Bayes 算法(87.61 0.96)

Naive Bayes算法——分类矩阵

说明:
其他类的538个样本有482个预测正确,32个错分为军师类,24个错分为将军类,预测正确率为89.59%;
军师20个样本有13个预测正确,7个错分为其他类,预测正确率为65%;
将军112个样本有92个预测正确,16个错分为其他类,4个错分为军师类,预测正确率为82.14%。
聚类分析算法——分类矩阵

说明:
其他类的538个样本有536个预测正确,2个错分为将军类,预测正确率为99.63%;
军师20个样本有0个预测正确,20个错分为其他类,预测正确率为0%;
将军112个样本有62个预测正确,50个错分为其他类,预测正确率为55.36%。
决策树算法——分类矩阵

说明:
其他类的538个样本有538个预测正确,预测正确率为100%;
军师20个样本有0个预测正确,20个错分为其他类,预测正确率为0%;
将军112个样本有73个预测正确,39个错分为其他类,预测正确率为65.18%。
神经网络算法——分类矩阵

说明:
其他类的538个样本有524个预测正确,5个错分为军师类,9个错分为将军类,预测正确率为97.40%;
军师20个样本有5个预测正确,15个错分为其他类,预测正确率为25%;
将军112个样本有92个预测正确,20个错分为其他类,预测正确率为82.14%。
逻辑回归算法——分类矩阵

说明:
其他类的538个样本有526个预测正确,6个错分为军师类,6个错分为将军类,预测正确率为97.77%;
军师20个样本有5个预测正确,15个错分为其他类,预测正确率为25%;
将军112个样本有88个预测正确,24个错分为其他类,预测正确率为78.57%。
关联算法——分类矩阵

说明:
其他类的538个样本有519个预测正确,19个错分为军师类,预测正确率为96.47%;
军师20个样本有0个预测正确,20个错分为其他类,预测正确率为0%;
将军112个样本有88个预测正确,24个错分为其他类,预测正确率为78.57%。
分类矩阵——预测正确率汇总分析:

 

其他

军师

将军

神经网络算法

97.40%

25%

82.14%

逻辑回归算法

97.77%

25%

78.57%

决策树算法

100%

0%

65.18%

关联算法

96.47%

0%

78.57%

聚类分析算法

99.63%

0%

55.36%

Naive Bayes 算法

89.59%

65%

82.14%

可以看出Naive Bayes 算法在预测军师身份正确率最高,达到65%,决策树算法、关联算法、聚类分析算法为0%,神经网络算法、逻辑回归算法为25%;
决策树算法在预测其他身份正确率最高,达到100%;
神经网络算法、Naive Bayes 算法在预测将军身份正确率并列,达到82.14%。

准确性验证示例2:——基于个股数据
数据准备:



挖掘模型依次为:
StockClustering 聚类分析算法
StrockDecisionTrees 决策树算法
StockNeuralNetWork 神经网络算法
StockLogistic 逻辑回归算法

提升图:

依次排名为:
1. 逻辑回归算法(49.73% 0.52)
2. 神经网络算法(49.63% 0.53)
3. 聚类分析算法(48.13% 0.51)
4. 决策树算法(47.28% 0.50)
聚类分析算法——分类矩阵:

说明:
持平的114个样本有0个预测正确,91个错分为跌,23个错分为涨,预测正确率为0%;
跌的443个样本有340个预测正确,103个错分为涨,预测正确率为76.75%;
涨的380个样本有111个预测正确,269个错分为跌,预测正确率为29.21%。

决策树算法——分类矩阵:

说明:
持平的114个样本有0个预测正确,114个错分为跌,预测正确率为0%;
跌的443个样本有443个预测正确,预测正确率为100.00%;
涨的380个样本有0个预测正确,380个错分为跌,预测正确率为0%。

神经网络算法——分类矩阵:

说明:
持平的114个样本有0个预测正确,60个错分为跌,54个错分为涨,预测正确率为0%;
跌的443个样本有277个预测正确,166个错分为涨,预测正确率为62.53%;
涨的380个样本有188个预测正确,192个错分为跌,预测正确率为49.47%。

逻辑回归算法——分类矩阵:

说明:
持平的114个样本有0个预测正确,89个错分为跌,25个错分为涨,预测正确率为0%;
跌的443个样本有380个预测正确,63个错分为涨,预测正确率为85.78%;
涨的380个样本有86个预测正确,294个错分为跌,预测正确率为22.63%。

分类矩阵——预测正确率汇总分析:

 

持平

逻辑回归算法

0%

85.78%

22.63%

神经网络算法

0%

62.53%

49.47%

聚类分析算法

0%

76.75%

29.21%

决策树算法

0%

100.00%

0%

目录
相关文章
|
2月前
|
机器学习/深度学习 自然语言处理 算法
【数据挖掘】金山办公2020校招大数据和机器学习算法笔试题
金山办公2020校招大数据和机器学习算法笔试题的解析,涵盖了编程、数据结构、正则表达式、机器学习等多个领域的题目和答案。
71 10
|
2月前
|
算法 数据挖掘 Python
【数据挖掘】十大算法之Apriori关联算法
Apriori关联算法,这是一种用于发现数据集中频繁项集和关联规则的数据挖掘技术,通过迭代过程找出满足最小支持度阈值的项集。
54 8
|
2月前
|
自然语言处理 算法 数据挖掘
【数据挖掘】十大算法之PageRank连接分析算法
文章介绍了PageRank算法的基本概念和数学模型,包括如何通过一阶马尔科夫链定义随机游走模型以及如何计算网页的重要性评分,并提供了PageRank迭代算法的具体步骤。
44 0
|
29天前
|
机器学习/深度学习 数据采集 算法
数据挖掘和机器学习算法
数据挖掘和机器学习算法
|
2月前
|
机器学习/深度学习 存储 人工智能
【数据挖掘】2022年2023届秋招知能科技公司机器学习算法工程师 笔试题
本文是关于2022-2023年知能科技公司机器学习算法工程师岗位的秋招笔试题,包括简答题和编程题,简答题涉及神经网络防止过拟合的方法、ReLU激活函数的使用原因以及条件概率计算,编程题包括路径行走时间计算和两车相向而行相遇时间问题。
63 2
【数据挖掘】2022年2023届秋招知能科技公司机器学习算法工程师 笔试题
|
2月前
|
机器学习/深度学习 自然语言处理 算法
【数据挖掘】2020奇安信秋招算法方向试卷1 笔试题解析
2020年奇安信秋招算法方向试卷1的题目解析,覆盖了数据结构、机器学习、深度学习、自然语言处理、排序算法、激活函数、主题模型、采样方法、图像处理等多个领域的知识点。
39 1
【数据挖掘】2020奇安信秋招算法方向试卷1 笔试题解析
|
2月前
|
机器学习/深度学习 存储 算法
【数据挖掘】2020奇安信秋招算法方向试卷3 笔试题解析
2020年奇安信秋招算法方向试卷3的题目解析,涵盖了数据结构、机器学习、深度学习、自然语言处理、排序算法、激活函数、PCA、词嵌入库等多个领域的知识点。
36 1
【数据挖掘】2020奇安信秋招算法方向试卷3 笔试题解析
|
2月前
|
机器学习/深度学习 人工智能 算法
【数据挖掘】2022年2023届秋招奇虎360机器学习算法工程师 笔试题
本文提供了奇虎360公司2022年秋招机器学习算法工程师岗位的笔试题内容,包括选择题和编程题,涉及概率统计、数据结构、机器学习、计算机组成原理等多个领域。
76 5
|
2月前
|
机器学习/深度学习 算法 数据挖掘
【数据挖掘】2022年2023届秋招宏瓴科技公司机器学习算法工程师 笔试题
关于宏瓴科技有限公司2022-2023年秋招机器学习算法工程师岗位的笔试题目及作者个人对部分题目的解答尝试,涉及贝叶斯误差和贝叶斯最优分类器的概念、贝叶斯误差的重要性和估算方法,以及如何有效利用训练集和测试集进行深度学习模型训练的数据集划分策略。
47 4
|
2月前
|
数据采集 资源调度 算法
【数据挖掘】十大算法之K-Means K均值聚类算法
K-Means聚类算法的基本介绍,包括算法步骤、损失函数、优缺点分析以及如何优化和改进算法的方法,还提到了几种改进的K-Means算法,如K-Means++和ISODATA算法。
86 4

热门文章

最新文章

下一篇
无影云桌面