干掉公式 —— numpy 就该这么学(二)

简介: 机器学习和数据分析变得越来越重要,但在学习和实践过程中,常常因为不知道怎么用程序实现各种数学公式而感到苦恼,今天我们从数学公式的角度上了解下,用 python 实现的方式方法。

求和与连乘

统计学公式中,求和运算很常见,例如对矩阵求和:

5.jpg


矩阵求和

表示对矩阵 m 中所有元素进行求和,nunpy 通过 sum 完成计算: m.sum()

连乘和求和类似,将矩阵中所有元素做乘积运算:

6.jpg

矩阵连乘

numpy 通过 prod 完成计算,如矩阵 m 的连乘为 m.prod()

实践

了解了上面的各种基础运算后,做些实践

计算均值

向量均值公式为:

7.jpg


向量均值公式

分析公式,其中 n 为向量 x 的元素数量,numpy 的向量,通过 size 获取,后面是向量求和,用 sum 完成,最后代码如下:

(1/x.size)*x.sum()

或者

x.sum()/x.size

实现 Frobenius 范数

现在来个复杂点的,Frobenius 范数,公式如下:

8.jpg


Frobenius 范数公式

先不用纠结 Frobenius 公式的意义,我们只看如何用 python 实现,分析公式,可以看到,首先对矩阵的每个元素做平方运算,然后求和,最后对结果进行开方,那么就从里向外写

矩阵元素求和,根据前面所述,写成 m**2,会得到新的矩阵,然后求和,直接可写为:

np.sqrt((m**2).sum())

借助 numpy 实现公式,极为简洁。

样本方差

我们看一个公式:

9.jpg


样本方差公式

其中11.jpg表示向量 x 的均值,上面计算过,那么套用起来就是:

np.sqrt(((x-(x.sum()/x.size))**2).sum()/(x.size-1))

基本依据上面了解的写法可以理解和写出,不过括号有点多,如果不参考公式,估计看不清实现的啥,好在 numpy 将均值运算通过 mean 方法简化了,例如向量 x 的均值,可以写为:np.mean(x),所以上面的代码可以简化为:

np.sqrt(((x-np.mean(x))**2).sum()/(x.size-1))

上面公式实际上是样本标准差公式,对于标准差,numpy 提供了简便方法 std, 直接用 np.std(x) 就可以计算,当然现在我们根据标准差公式:

10.jpg


标准差

很容易写出来 numpy 实现,赶紧试试吧。

欧拉距离

前面写模拟疫情扩散时,用到了欧拉距离,当时没有理解好 numpy 公式表达能力,所以计算时分了三步,现在如果要计算两个向量之间的欧拉距离,一行代码就能搞定,先复习下欧拉距离公式,向量 a 与 向量 b 的欧拉距离为:

12.jpg


欧拉距离公式

numpy 实现为:

np.sqrt(((a-b)**2).sum())

由于欧拉距离应用广泛,所以 numpy 在线性代数模块中实现了,所以了解 numpy 实现数学公式的方法后,可以简化为:

np.linalg.norm(a-b)

总结

numpy 是个博大精深的数学计算库,是 python 实现科学计算的基础,今天我们从数学公式的角度,了解了如何转换为 numpy 的代码实现,限于篇幅,虽然仅是 numpy 的冰山一角,但却可以成为理解 numpy 运算原理的思路,在数据分析或者机器学习,或者论文写作过程中,即使不了解 numpy 中简洁的运算,也可以根据数学公式写出代码实现,进而通过实践学习和了解 numpy 就更容易了

目录
相关文章
|
关系型数据库 MySQL 索引
【mysql】MySQL 复合索引
【mysql】MySQL 复合索引
248 0
|
数据安全/隐私保护
关于 OAuth 2.0 统一认证授权
随着互联网的巨头大佬逐渐积累了海量的用户与数据,用户的需求越来越多样化,为了满足用户在不同平台活动的需求,平台级的厂商则需要以接口的形式开放给第三方开发者,这样满足了用户的多样性需求,也可以让自己获得利益,让数据流动起来,形成给一个良性的生态环境,最终达到用户、平台商、第三方开发者共赢。
3186 0
|
11月前
|
XML 前端开发 Java
讲解SSM的xml文件
本文详细介绍了SSM框架中的xml配置文件,包括springMVC.xml和applicationContext.xml,涉及组件扫描、数据源配置、事务管理、MyBatis集成以及Spring MVC的视图解析器配置。
221 1
|
监控 数据挖掘 数据安全/隐私保护
ERP系统中的报价与报价管理模块解析
【7月更文挑战第25天】 ERP系统中的报价与报价管理模块解析
856 3
|
机器学习/深度学习 人工智能 机器人
人工智能与自动化:重塑未来工作场景
【8月更文第8天】随着技术的飞速发展,人工智能(AI)和自动化已成为推动各行各业变革的关键力量。这些技术不仅提高了生产效率,还为传统工作岗位带来了新的活力,并创造出了许多全新的职业领域。本文将探讨AI和自动化如何重塑工作场景,并通过具体的编程示例来展示如何利用这些技术。
400 1
|
9月前
|
JSON 自然语言处理 Java
OpenAI API深度解析:参数、Token、计费与多种调用方式
随着人工智能技术的飞速发展,OpenAI API已成为许多开发者和企业的得力助手。本文将深入探讨OpenAI API的参数、Token、计费方式,以及如何通过Rest API(以Postman为例)、Java API调用、工具调用等方式实现与OpenAI的交互,并特别关注调用具有视觉功能的GPT-4o使用本地图片的功能。此外,本文还将介绍JSON模式、可重现输出的seed机制、使用代码统计Token数量、开发控制台循环聊天,以及基于最大Token数量的消息列表限制和会话长度管理的控制台循环聊天。
3247 7
|
11月前
|
存储 C++ 索引
C++函数指针详解
【10月更文挑战第3天】本文介绍了C++中的函数指针概念、定义与应用。函数指针是一种指向函数的特殊指针,其类型取决于函数的返回值与参数类型。定义函数指针需指定返回类型和参数列表,如 `int (*funcPtr)(int, int);`。通过赋值函数名给指针,即可调用该函数,支持两种调用格式:`(*funcPtr)(参数)` 和 `funcPtr(参数)`。函数指针还可作为参数传递给其他函数,增强程序灵活性。此外,也可创建函数指针数组,存储多个函数指针。
230 6
|
安全 Java Maven
如何使用jsoup实现网站登录,cookie保存,查询信息
【6月更文挑战第11天】如何使用jsoup实现网站登录,cookie保存,查询信息
476 1
|
机器学习/深度学习 PyTorch TensorFlow
文件系统之软连接、硬链接的区别/文件删除与空间的联系/df和du的区别
文件系统之软连接、硬链接的区别/文件删除与空间的联系/df和du的区别