机器学习库:numpy

简介: 机器学习库:numpy



写在开头

机器学习中,我们除了关注模型的性能外,数据处理更是必不可少,本文将介绍一个重要的数据处理库numpy,将随着我的学习过程不断增加内容

基本数据格式

array

array矩阵是numpy中的数据格式,array格式有很多便捷的操作,如矩阵运算,广播等

使用代码

import numpy as np
 
 
arr = np.array([1, 2, 3, 4, 5])
print(type(arr))

矩阵运算

numpy数据与普通数据的一个重要区别就是它能调用函数进行矩阵运算

创建矩阵

import numpy as np
 
# 创建矩阵
A = np.array([[1, 2], [3, 4]])
B = np.array([[5, 6], [7, 8]])

矩阵加法

# 矩阵加法
C = A + B
print("Matrix Addition:")
print(C)

矩阵减法

# 矩阵减法
D = A - B
print("Matrix Subtraction:")
print(D)

矩阵乘法

# 矩阵乘法
E = np.dot(A, B)
print("Matrix Multiplication:")
print(E)

矩阵转置

# 矩阵转置
A_transposed = A.T
print("Matrix Transposition:")
print(A_transposed)

数据定位

argmax

argmax函数返回array矩阵中元素值最大的下标

使用代码

import numpy as np
 
 
arr = np.array([1, 4, 5, 2, 3])
print(np.argmax(arr))

数据生成

random.rand

这个函数会生成指定格式的(0,1)之间的数

import numpy as np
 
 
arr = np.random.rand(3, 4)
print(arr)

这段代码生成一个3x4的矩阵

random.randn

这个函数生成标准正态分布(均值为 0,标准差为 1)的随机样本

import numpy as np
 
 
arr = np.random.randn(3, 4)
print(arr)

random.randint

这个函数生成在指定范围内的随机整数。

import numpy as np
 
 
arr = np.random.randint(1, 10, size=(3, 4))
print(arr)

这个代码将生成数据从1到10(不包括)的整数,形状为3x4的矩阵

维度拓展

expand_dim

在机器学习任务中,有些模型对数据的格式有要求,这时我们可以使用expand_dim函数来拓展数据的维度

import numpy as np
 
 
arr = np.random.randint(1, 10, size=(3, 4))
print(arr)
print(np.expand_dims(arr, axis=0)) # 在第0个维度上拓展
print(np.expand_dims(arr, axis=1)) # 在第1个维度上拓展

可以看看效果

结语

numpy作为一个数据处理库,它主要用来进行数据生成,数据计算等任务,支撑着人工智能必不可少的数据处理任务

感谢阅读,觉得有用的话就订阅下本专栏吧

相关文章
|
2月前
|
数据采集 机器学习/深度学习 存储
【机器学习】数据清洗——基于Numpy库的方法删除重复点
【机器学习】数据清洗——基于Numpy库的方法删除重复点
117 1
|
9月前
|
存储 机器学习/深度学习 人工智能
机器学习 | NumPy超详细教程
机器学习 | NumPy超详细教程
117 0
|
17天前
|
机器学习/深度学习 人工智能 资源调度
机器学习之numpy基础——线性代数,不要太简单哦
机器学习之numpy基础——线性代数,不要太简单哦
39 6
|
2天前
|
机器学习/深度学习 数据可视化 搜索推荐
Python在社交媒体分析中扮演关键角色,借助Pandas、NumPy、Matplotlib等工具处理、可视化数据及进行机器学习。
【7月更文挑战第5天】Python在社交媒体分析中扮演关键角色,借助Pandas、NumPy、Matplotlib等工具处理、可视化数据及进行机器学习。流程包括数据获取、预处理、探索、模型选择、评估与优化,以及结果可视化。示例展示了用户行为、话题趋势和用户画像分析。Python的丰富生态使得社交媒体洞察变得高效。通过学习和实践,可以提升社交媒体分析能力。
10 0
|
26天前
|
机器学习/深度学习 人工智能 IDE
人工智能平台PAI操作报错合集之交互式建模(DSW)环境中,numpy模块如何正确安装
阿里云人工智能平台PAI (Platform for Artificial Intelligence) 是阿里云推出的一套全面、易用的机器学习和深度学习平台,旨在帮助企业、开发者和数据科学家快速构建、训练、部署和管理人工智能模型。在使用阿里云人工智能平台PAI进行操作时,可能会遇到各种类型的错误。以下列举了一些常见的报错情况及其可能的原因和解决方法。
|
2月前
|
机器学习/深度学习 数据采集 算法
探索NumPy与机器学习库的集成之路
【4月更文挑战第17天】本文探讨了NumPy在机器学习中的核心作用,它为各类机器学习库提供基础数据处理和数值计算能力。NumPy的线性代数、优化算法和随机数生成等功能,对实现高效模型训练至关重要。scikit-learn等库广泛依赖NumPy进行数据预处理。未来,尽管面临大数据和复杂模型的性能挑战,NumPy与机器学习库的集成将继续深化,推动技术创新。
|
2月前
|
机器学习/深度学习 数据采集 PyTorch
《Numpy 简易速速上手小册》第9章:Numpy 在机器学习中的应用(2024 最新版)
《Numpy 简易速速上手小册》第9章:Numpy 在机器学习中的应用(2024 最新版)
24 0
|
9月前
|
机器学习/深度学习 数据可视化 Python
【Python机器学习】实验01 Numpy以及可视化回顾
【Python机器学习】实验01 Numpy以及可视化回顾
129 2
|
10天前
|
数据采集 机器学习/深度学习 算法
机器学习方法之决策树算法
决策树算法是一种常用的机器学习方法,可以应用于分类和回归任务。通过递归地将数据集划分为更小的子集,从而形成一棵树状的结构模型。每个内部节点代表一个特征的判断,每个分支代表这个特征的某个取值或范围,每个叶节点则表示预测结果。
32 1
|
14天前
|
机器学习/深度学习 人工智能 算法
【昆虫识别系统】图像识别Python+卷积神经网络算法+人工智能+深度学习+机器学习+TensorFlow+ResNet50
昆虫识别系统,使用Python作为主要开发语言。通过TensorFlow搭建ResNet50卷积神经网络算法(CNN)模型。通过对10种常见的昆虫图片数据集('蜜蜂', '甲虫', '蝴蝶', '蝉', '蜻蜓', '蚱蜢', '蛾', '蝎子', '蜗牛', '蜘蛛')进行训练,得到一个识别精度较高的H5格式模型文件,然后使用Django搭建Web网页端可视化操作界面,实现用户上传一张昆虫图片识别其名称。
152 7
【昆虫识别系统】图像识别Python+卷积神经网络算法+人工智能+深度学习+机器学习+TensorFlow+ResNet50