最近在coding的时候,写的代码中只有一层循环,却很耗时
,不明觉厉
。不知道是哪里出了问题,于是我就在每一行代码中都打印一下耗时,最终发现了这个罪魁祸首
。这里我只说明两个我遇到耗时的场景,当然还有很多其他的方法可能也是一样的,这里只是提供问题的思路!
说明:
这里比较耗时,是我在外层使用了循环,在循环内部调用了列表的remove()方法
、使用了if xxx in xx
判断等类似操作!
1 python列表的remove方法比较耗时原因
1、例如,下面的伪代码
- 首先是循环
- 然后通过remove删除字典对应value列表中的一个元素
就是在remove删除列表元素的过程,其实是相当对这个value列表进行循环,当循环到要删除的元素后,循环停止!
因此这段代码的时间复杂度就是$<=O^2$,几乎就等价于两层for循环,因此当第一层循环有80W,第二层有1w,这个循环就已经非常耗时了!
data = {
'a': [], 'b': [], ...}
for key, value in data.items():
value.remove('xxx')
2、判断if xxx in xx条件比较耗时问题
1、例如,如下的伪代码
data = {
'a': [], 'b': [], ...}
for key, value in data.items():
if xxx in xx
如果判断元素xxx是否在xx中,加入这个xx是一个列表,其实在判断的过程中,也是类似先对列表进行循环,让元素xxx和列表中的xx每个元素做对比,如果提前比对到就停止循环,和上面的remove()方法都是类似的,因此也会比较耗时!
因此,在写代码的时候一定想办法让代码更简洁,同时保证高效性
!