机器学习库:numpy

简介: 机器学习库:numpy



写在开头

机器学习中,我们除了关注模型的性能外,数据处理更是必不可少,本文将介绍一个重要的数据处理库numpy,将随着我的学习过程不断增加内容

基本数据格式

array

array矩阵是numpy中的数据格式,array格式有很多便捷的操作,如矩阵运算,广播等

使用代码

import numpy as np
 
 
arr = np.array([1, 2, 3, 4, 5])
print(type(arr))

矩阵运算

numpy数据与普通数据的一个重要区别就是它能调用函数进行矩阵运算

创建矩阵

import numpy as np
 
# 创建矩阵
A = np.array([[1, 2], [3, 4]])
B = np.array([[5, 6], [7, 8]])

矩阵加法

# 矩阵加法
C = A + B
print("Matrix Addition:")
print(C)

矩阵减法

# 矩阵减法
D = A - B
print("Matrix Subtraction:")
print(D)

矩阵乘法

# 矩阵乘法
E = np.dot(A, B)
print("Matrix Multiplication:")
print(E)

矩阵转置

# 矩阵转置
A_transposed = A.T
print("Matrix Transposition:")
print(A_transposed)

数据定位

argmax

argmax函数返回array矩阵中元素值最大的下标

使用代码

import numpy as np
 
 
arr = np.array([1, 4, 5, 2, 3])
print(np.argmax(arr))

数据生成

random.rand

这个函数会生成指定格式的(0,1)之间的数

import numpy as np
 
 
arr = np.random.rand(3, 4)
print(arr)

这段代码生成一个3x4的矩阵

random.randn

这个函数生成标准正态分布(均值为 0,标准差为 1)的随机样本

import numpy as np
 
 
arr = np.random.randn(3, 4)
print(arr)

random.randint

这个函数生成在指定范围内的随机整数。

import numpy as np
 
 
arr = np.random.randint(1, 10, size=(3, 4))
print(arr)

这个代码将生成数据从1到10(不包括)的整数,形状为3x4的矩阵

维度拓展

expand_dim

在机器学习任务中,有些模型对数据的格式有要求,这时我们可以使用expand_dim函数来拓展数据的维度

import numpy as np
 
 
arr = np.random.randint(1, 10, size=(3, 4))
print(arr)
print(np.expand_dims(arr, axis=0)) # 在第0个维度上拓展
print(np.expand_dims(arr, axis=1)) # 在第1个维度上拓展

可以看看效果

结语

numpy作为一个数据处理库,它主要用来进行数据生成,数据计算等任务,支撑着人工智能必不可少的数据处理任务

感谢阅读,觉得有用的话就订阅下本专栏吧

相关文章
|
5月前
|
机器学习/深度学习 数据可视化 搜索推荐
Python在社交媒体分析中扮演关键角色,借助Pandas、NumPy、Matplotlib等工具处理、可视化数据及进行机器学习。
【7月更文挑战第5天】Python在社交媒体分析中扮演关键角色,借助Pandas、NumPy、Matplotlib等工具处理、可视化数据及进行机器学习。流程包括数据获取、预处理、探索、模型选择、评估与优化,以及结果可视化。示例展示了用户行为、话题趋势和用户画像分析。Python的丰富生态使得社交媒体洞察变得高效。通过学习和实践,可以提升社交媒体分析能力。
89 1
|
2月前
|
机器学习/深度学习 算法 数据挖掘
【Python篇】深度探索NumPy(下篇):从科学计算到机器学习的高效实战技巧1
【Python篇】深度探索NumPy(下篇):从科学计算到机器学习的高效实战技巧
60 5
|
2月前
|
机器学习/深度学习 算法 数据可视化
【Python篇】深度探索NumPy(下篇):从科学计算到机器学习的高效实战技巧2
【Python篇】深度探索NumPy(下篇):从科学计算到机器学习的高效实战技巧
45 1
|
4月前
|
机器学习/深度学习 PyTorch TensorFlow
NumPy 与机器学习框架的集成
【8月更文第30天】NumPy 是 Python 中用于科学计算的核心库之一,它提供了高效的多维数组对象,以及用于操作数组的大量函数。NumPy 的高效性和灵活性使其成为许多机器学习框架的基础。本文将探讨 NumPy 如何与 TensorFlow 和 PyTorch 等流行机器学习框架协同工作,并通过具体的代码示例来展示它们之间的交互。
66 0
|
5月前
|
机器学习/深度学习 数据采集 大数据
驾驭大数据洪流:Pandas与NumPy在高效数据处理与机器学习中的核心作用
【7月更文挑战第13天】在大数据时代,Pandas与NumPy是Python数据分析的核心,用于处理复杂数据集。在一个电商销售数据案例中,首先使用Pandas的`read_csv`加载CSV数据,通过`head`和`describe`进行初步探索。接着,数据清洗涉及填充缺失值和删除异常数据。然后,利用`groupby`和`aggregate`分析销售趋势,并用Matplotlib可视化结果。在机器学习预处理阶段,借助NumPy进行数组操作,如特征缩放。Pandas的数据操作便捷性与NumPy的数值计算效率,共同助力高效的数据分析和建模。
104 3
|
5月前
|
机器学习/深度学习 数据采集 数据处理
重构数据处理流程:Pandas与NumPy高级特性在机器学习前的优化
【7月更文挑战第14天】在数据科学中,Pandas和NumPy是数据处理的关键,用于清洗、转换和计算。用`pip install pandas numpy`安装后,Pandas的`read_csv`读取数据,`fillna`处理缺失值,`drop`删除列。Pandas的`apply`、`groupby`和`merge`执行复杂转换。NumPy加速数值计算,如`square`进行向量化操作,`dot`做矩阵乘法。结合两者优化数据预处理,提升模型训练效率和效果。
74 1
|
6月前
|
机器学习/深度学习 人工智能 资源调度
机器学习之numpy基础——线性代数,不要太简单哦
机器学习之numpy基础——线性代数,不要太简单哦
85 6
|
6月前
|
机器学习/深度学习 人工智能 IDE
人工智能平台PAI操作报错合集之交互式建模(DSW)环境中,numpy模块如何正确安装
阿里云人工智能平台PAI (Platform for Artificial Intelligence) 是阿里云推出的一套全面、易用的机器学习和深度学习平台,旨在帮助企业、开发者和数据科学家快速构建、训练、部署和管理人工智能模型。在使用阿里云人工智能平台PAI进行操作时,可能会遇到各种类型的错误。以下列举了一些常见的报错情况及其可能的原因和解决方法。
|
7月前
|
机器学习/深度学习 数据采集 算法
探索NumPy与机器学习库的集成之路
【4月更文挑战第17天】本文探讨了NumPy在机器学习中的核心作用,它为各类机器学习库提供基础数据处理和数值计算能力。NumPy的线性代数、优化算法和随机数生成等功能,对实现高效模型训练至关重要。scikit-learn等库广泛依赖NumPy进行数据预处理。未来,尽管面临大数据和复杂模型的性能挑战,NumPy与机器学习库的集成将继续深化,推动技术创新。
|
7月前
|
机器学习/深度学习 数据采集 PyTorch
《Numpy 简易速速上手小册》第9章:Numpy 在机器学习中的应用(2024 最新版)
《Numpy 简易速速上手小册》第9章:Numpy 在机器学习中的应用(2024 最新版)
67 0
下一篇
DataWorks