文档备案控制台

开发者社区人工智能文章正文

机器学习实战决策树代码计算香农熵 Error return arrays must be of ArrayType

2023-02-01 330

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 机器学习实战决策树代码计算香农熵 Error return arrays must be of ArrayType

from math import log
import xlrd
***# from numpy import ****
import operator
def calcShannonEnt(dataSet):#calculata shannonEnt
    numEntries = len(dataSet)
    labelCounts = {}
    for featVec in dataSet:#将当前键值加入字典并记录类别出现的次数
        currentLabel = featVec[-1]
        if currentLabel not in labelCounts.keys():
            labelCounts[currentLabel] = 0
        labelCounts[currentLabel] += 1
    shannonEnt = 0.0
    for key in labelCounts:#计算香农熵
        prob = float(labelCounts[key])/numEntries#使用所有类标签的发生频率计算类别出现的概率
        tmp = prob*log(prob,2)
        shannonEnt -= tmp#得到香农熵
    return shannonEnt

代码在运行时会出现TypeError: return arrays must be of ArrayType的错误，因为log的第二个参数不是base而是out array。如果你只是想执行普通的log操作，可以选择使用numpy.math.log(1.1, 2)或者使用python自带的math模块的log函数，而不是导入numpy中所有的函数TT

文章知识点与官方知识档案匹配，可进一步学习相关知识

算法技能树首页概览36043 人正在系统学习中

AIEarth是一个由众多领域内专家博主共同打造的学术平台，旨在建设一个拥抱智慧未来的学术殿堂！【平台地址：https://devpress.csdn.net/aiearth】很高兴认识你！加入我们共同进步！

文章标签：

Python

机器学习/深度学习

算法

关键词：

人工智能平台 PAI实战

人工智能平台 PAI代码

人工智能平台 PAI决策

人工智能平台 PAI实战代码

人工智能平台 PAI计算

AIEarth

目录

相关文章

Deephub

|

12月前

|

机器学习/深度学习存储运维

机器学习异常检测实战：用Isolation Forest快速构建无标签异常检测系统

本研究通过实验演示了异常标记如何逐步完善异常检测方案和主要分类模型在欺诈检测中的应用。实验结果表明，Isolation Forest作为一个强大的异常检测模型，无需显式建模正常模式即可有效工作，在处理未见风险事件方面具有显著优势。

Deephub

980 46 46

Deephub

|

机器学习/深度学习人工智能算法

PaperCoder：一种利用大型语言模型自动生成机器学习论文代码的框架

PaperCoder是一种基于多智能体LLM框架的工具，可自动将机器学习研究论文转化为代码库。它通过规划、分析和生成三个阶段，系统性地实现从论文到代码的转化，解决当前研究中代码缺失导致的可复现性问题。实验表明，PaperCoder在自动生成高质量代码方面显著优于基线方法，并获得专家高度认可。这一工具降低了验证研究成果的门槛，推动科研透明与高效。

Deephub

1030 19 19

PaperCoder：一种利用大型语言模型自动生成机器学习论文代码的框架

游客4rnkeq2m7q5hy

|

机器学习/深度学习数据可视化 TensorFlow

Python 高级编程与实战：深入理解数据科学与机器学习

本文深入探讨了Python在数据科学与机器学习中的应用，介绍了pandas、numpy、matplotlib等数据科学工具，以及scikit-learn、tensorflow、keras等机器学习库。通过实战项目，如数据可视化和鸢尾花数据集分类，帮助读者掌握这些技术。最后提供了进一步学习资源，助力提升Python编程技能。

游客4rnkeq2m7q5hy

489 21 21

喜欢猪猪

|

机器学习/深度学习人工智能 Java

Java机器学习实战：基于DJL框架的手写数字识别全解析

在人工智能蓬勃发展的今天，Python凭借丰富的生态库（如TensorFlow、PyTorch）成为AI开发的首选语言。但Java作为企业级应用的基石，其在生产环境部署、性能优化和工程化方面的优势不容忽视。DJL（Deep Java Library）的出现完美填补了Java在深度学习领域的空白，它提供了一套统一的API，允许开发者无缝对接主流深度学习框架，将AI模型高效部署到Java生态中。本文将通过手写数字识别的完整流程，深入解析DJL框架的核心机制与应用实践。

喜欢猪猪

942 3 3

游客4rnkeq2m7q5hy

|

机器学习/深度学习数据可视化算法

Python 高级编程与实战：深入理解数据科学与机器学习

在前几篇文章中，我们探讨了 Python 的基础语法、面向对象编程、函数式编程、元编程、性能优化和调试技巧。本文将深入探讨 Python 在数据科学和机器学习中的应用，并通过实战项目帮助你掌握这些技术。

游客4rnkeq2m7q5hy

411 6 6

码农小达人

|

数据可视化 API 开发者

R1类模型推理能力评测手把手实战

R1类模型推理能力评测手把手实战

码农小达人

497 2 2

张柏镒

|

机器学习/深度学习人工智能开发者

DeepSeek服务器繁忙？拒绝稍后再试！基于阿里云PAI实现0代码一键部署DeepSeek-V3和DeepSeek-R1大模型

阿里云PAI平台支持零代码一键部署DeepSeek-V3和DeepSeek-R1大模型，用户可轻松实现从训练到部署再到推理的全流程。通过PAI Model Gallery，开发者只需简单几步即可完成模型部署，享受高效便捷的AI开发体验。具体步骤包括开通PAI服务、进入控制台选择模型、一键部署并获取调用信息。整个过程无需编写代码，极大简化了模型应用的门槛。

张柏镒

691 7 7

DataWorks@佳里

|

人工智能自然语言处理网络安全

基于阿里云 Milvus + DeepSeek + PAI LangStudio 的低成本高精度 RAG 实战

阿里云向量检索服务Milvus版是一款全托管向量检索引擎，并确保与开源Milvus的完全兼容性，支持无缝迁移。它在开源版本的基础上增强了可扩展性，能提供大规模AI向量数据的相似性检索服务。凭借其开箱即用的特性、灵活的扩展能力和全链路监控告警，Milvus云服务成为多样化AI应用场景的理想选择，包括多模态搜索、检索增强生成（RAG）、搜索推荐、内容风险识别等。您还可以利用开源的Attu工具进行可视化操作，进一步促进应用的快速开发和部署。

DataWorks@佳里

1154 1 2

modelscope

|

数据可视化 API 开发者

R1类模型推理能力评测手把手实战

随着DeepSeek-R1模型的广泛应用，越来越多的开发者开始尝试复现类似的模型，以提升其推理能力。

modelscope

1363 2 2

modelscope

|

数据可视化 API 开发者

R1类模型推理能力评测手把手实战

随着DeepSeek-R1模型的广泛应用，越来越多的开发者开始尝试复现类似的模型，以提升其推理能力。

modelscope

904 3 3

热门文章

最新文章

SparkML机器学习之特征工程（二）特征转化（Binarizer、StandardScaler、MaxAbsScaler、Normalizer、N-gram、Tokenizer等）

手把手丨我们在UCL找到了一个糖尿病数据集，用机器学习预测糖尿病

机器学习：Sklearn算法选择路径图

【机器学习】协方差和相关性有什么区别？

【机器学习】十大算法之一 “神经网络”

机器学习面试笔试知识点-线性回归、逻辑回归(Logistics Regression)和支持向量机(SVM)

阿里巴巴开源大规模稀疏模型训练/预测引擎DeepRec

阿里云PAI：一站式AI研发平台，引领深度学习潮流

《meaching learning》机器学习学习记录3.多类分类

第十二届“中国软件杯”大赛：A10-基于机器学习的分布式系统故障诊断系统——baseline（一）

深度学习500问——Chapter02：机器学习基础（5）

深度学习500问——Chapter02：机器学习基础（2）

深度学习500问——Chapter02：机器学习基础（1）

【机器学习】样本、特征、标签：构建智能模型的三大基石

【机器学习】包裹式特征选择之基于模型的特征选择法

利用机器学习优化数据中心的能源效率

利用机器学习优化数据中心的能源效率

构建高效机器学习模型的策略与实践

利用机器学习算法改善电商推荐系统的效率

构建高效机器学习模型的策略与实践

相关课程

更多

PAI平台学习路线：机器学习入门到应用

场景实践 - 机器学习PAI实现精细化营销

场景实践 - 基于阿里云PAI机器学习平台使用时间序列分解模型预测商品销量

场景实践 - 基于机器学习进行收入预测分析

机器学习概览及常见算法

机器学习入门-概念原理及常用算法

相关电子书

更多

机器学习在恶意样本检测方面的实践之路

大规模机器学习在蚂蚁+阿里的应用

阿里巴巴机器学习平台AI

相关实验场景

更多

使用PAI+LLaMA Factory微调Qwen2-VL模型，搭建文旅领域知识问答机器人

在PAI ArtLab一键设计AIGC新春红包

下一篇

阿里云数据库产品支持免费试用吗？最新可试用数据库规格信息、配置及可试用人群参考