1、引言
小屌丝:鱼哥,我今天被鄙视了
小鱼:因为你的颜值被鄙视了??
小屌丝:咱还能正常聊天吗??
小鱼:好吧,我已经很正经的说话了,那你说吧,因为啥被鄙视了?
小屌丝:今天一个小菜鸟说C语言是世界上运行速度最快的语言,我非常不服气~~
小鱼:那有啥不服气的,我都觉得这话说得没啥毛病。
小屌丝:鱼哥,小姐姐说谁的速度快,就跟谁YYSX。
小鱼:那…这… 我赞同,我也表示不不服。
2、Numba
关于Numba的详细文档,点击Numba传送门即被可传送。
但是文档归文档,我们还是要简单的说一下Numba。
2.1 简介
numba 是一款可以将 python 函数编译为机器代码的JIT编译器,经过 numba 编译的python 代码(仅限数组运算),其运行速度可以接近 C 或 FORTRAN 语言。
小屌丝:看样子很厉害的哦,那使用起来,是不是很难呢?
小鱼:不难不难,到底有多容易,请往下看:
三不要:
不需要替换Python解析器
不需要单独编译
不需要安装C/C++编译器
一需要:
将 Numba 提供的装饰器放在 Python 函数上面就行
小屌丝:哎哟~总结的还挺到位。
小鱼:没事别说话,打断我思路了都!!
2.2 安装
在撸码前,需要确认,是否已经有numba这个库,
如果没有的话,那我们回想一下,有几种方法呢????
不管哪种方法,能安装上就是可行的。
在这里,小鱼就直接举例单独安装:
pip install numba
详细可参考:
《Python3:我低调的只用一行代码,就导入Python所有库!》;
《Python3,选择Python自动安装第三方库,从此跟pip说拜拜!!》
2.3 代码实例
安装完numba库,那就直接上代码,展示一下速度…
看看能不能比我们的苏神跑的快!
实例一:
我们看看调用jit的样子
# -*- coding:utf-8 -*- # @Time : 2021-08-08 # @Author : carl_DJ from numba import jit import random # 调用jit装饰器 @jit(nopython=True) def mot_pi(nsamples): acc =0 for i in range(nsamples): x = random.random() y = random.random() if (x ** 2 + y ** 2) <1.0 : acc +=1 return 8.0 * acc /nsamples
实例二
Numba 是专为科学计算而设计的,在与 NumPy 一起使用时,Numba 会为不同的数组数据类型生成专门的代码,以优化性能为主,
上代码:
# -*- coding:utf-8 -*- # @Time : 2021-08-08 # @Author : carl_DJ @numba.jit(nopython=True, parallel=True) def logistic_regress(X, Y, w, iterations): for i in range(iterations): w -= np.dot(((1.0 / (1.0 + np.exp(-Y * np.dot(X, w))) - 1.0) * Y), X) return w
小屌丝:这个…我看不懂…
小鱼:看不懂啊,没关系,毕竟不是每个人都对科学计算有兴趣。
小屌丝:你这是在侮(xiu)辱我!!!
小鱼:你不配~ ~
如果大家看不懂这个实例,没事没事,别灰心,
接下来,我们就来搞个大一点的事情。
3、 代码实战
上面的代码,就是一个热身了~ ~
接下来,我们就用正儿八经的例子,看看Numba的运行速度有多快。
有了苏神的速度,还担心妹子不跟咱YYXS吗!!
举个例子
我们使用和不使用Numba,来找出1000个W以内所有的素数。
3.1 不使用Numba
我们不使用Numba,来看看花费多长时间。
上代码
# -*- coding:utf-8 -*- # @Time : 2021-08-08 # @Author : carl_DJ import math import time def is_prime(num): if num == 2: return True if num <= 1 or not num % 2: return False for div in range(3, int(math.sqrt(num) + 1), 2): if not num % div: return False return True def run_program(N): total = 0 for i in range(N): if is_prime(i): total += 1 return total if __name__ == "__main__": N = 10000000 start = time.time() total = run_program(N) end = time.time() print(f"1000W以内所有的素数是: {total}") print(f"耗时: {end - start}s")
运行结果
1000W以内所有的素数是: 664579 耗时: 245.93426966667175s
小屌丝:好吧,这运行速度,确实有点…
小鱼:别灰心啊,我们不是还有Numba吗。
3.2 使用Numba
我们使用Numba,看看花费多长时间。
上代码
# -*- coding:utf-8 -*- # @Time : 2021-08-08 # @Author : carl_DJ import math import time from numba import njit # @njit 相当于 @jit(nopython=True) @njit def is_prime(num): if num == 2: return True if num <= 1 or not num % 2: return False for div in range(3, int(math.sqrt(num) + 1), 2): if not num % div: return False return True # #普通循环计算, # @njit # def run_program(N): # total = 0 # #普通range循环处理 # for i in range(N): # if is_prime(i): # total += 1 # return total #使用Numba的prange来进行并发循环计算 @njit(parallel = True) def run_program(N): total = 0 #使用Numba提供的prange参数来进行并行计算 for i in prange(N): if is_prime(i): total += 1 return total if __name__ == "__main__": N = 10000000 start = time.time() total = run_program(N) end = time.time() print(f"1000W以内所有的素数是: {total}") print(f"耗时: {end - start}s")
运行结果
- 未使用Numba的prange运行结果,如下:
1000W以内所有的素数是: 664579 耗时: 11.453454494476318s
使用Numba的prange运行结果,如下:
total prime num is 664579 cost 5.30582857131958s
小屌丝:我的天啊, 这么神奇吗~
小鱼:必须的。
小屌丝:鱼哥,鱼哥,它是怎么做到的??
小鱼:嗯,我们来看看官方文档怎么解释的。
官方文档解释:
它读取装饰函数的 Python 字节码,并将其与有关函数输入参数类型的信息结合起来,分析和优化代码,最后使用编译器库(LLVM)针对你的 CPU 生成量身定制的机器代码。每次调用函数时,都会使用此编译版本,
小屌丝:原来如此…看来我今晚和小姐姐YYSX 是有戏了。
小鱼:就这点出息了!!!
4、总结
虽然Python是动态语言,有全局解释器锁,比其他静态语言要慢,
但是,通过今天小鱼分享的Numba,是不是把你心中那一团火又燃烧了。
说归说,闹归闹,官方文档最重要!
所以,关于更多的Numba的知识,还请异步到官方文档
倒数三个数,开始上链接,宝宝们准备好。
3
2
1