[Python] 高效比对两个列表的不同

简介: [Python] 高效比对两个列表的不同
1.概要说明:


通过不断的测试发现,python实现高效快速比对两个列表的不同,可借助python集合set()提供的集合运算进行操作,此方式效率非常高.


而在java语言中,如下方法中方法1相比方法2(集合运算)的方式效率更高速度更快一些.这算是两种语言相通之处的一点不同吧.


2.代码:

#-*- coding:utf-8 -*-
import time
#方法1:
def getDiff1(arr1,arr2):
    start_time = time.time()
    print('1_start:',start_time)
    arr_more1 = []
    arr_more2 = []
    dic_result = {}
    for str_1 in arr1:
        dic_result[str(str_1)] = 1
    for str_2 in arr2:
        if dic_result.get(str(str_2)):
            dic_result[str(str_2)] = 2
        else:
            arr_more2.append(str_2)
    for key,val in dic_result.items():
        if val == 1:
            arr_more1.append(key)
    print('arr1比arr2多的内容为:',len(arr_more1))
    print('arr2比arr1多的内容为:',len(arr_more2))
    end_time = time.time()
    print('1_end:',end_time)
    print('方法1_比对用时为',end_time-start_time)
#方法2:使用集合运算:
def getDiff2(arr1,arr2):
    start_time = time.time()
    print('2_start:',start_time)
    set_1 = ()
    set_2 = ()
    #将列表转换为集合set()
    set_1 = set(arr1)
    set_2 = set(arr2)
    set_more1 = ()
    set_more2 = ()
    #集合运算
    set_1_2 = set_1 & set_2
    set_more1 = set_1 -set_1_2
    set_more2 = set_2 -set_1_2
    print('arr1比arr2多的内容为:',len(set_more1))
    print('arr2比arr1多的内容为:',len(set_more2))
    end_time = time.time()
    print('2_end:',end_time)
    print('方法2_比对用时为',end_time-start_time)
#测试
# 初始化500w条数据数据
arr1 = []
arr2 = []
i = 0
while(True):
    arr1.append(i * 2)
    arr2.append(i * 3)
    i += 1
    if i > 5000000:
        break
print('arr1的长度为:',len(arr1))
print('arr2的长度为:',len(arr2))
print('+'*30)
getDiff1(arr1,arr2)
print('-'*30)
getDiff2(arr1,arr2)


3.运行结果:

D:\python_project\venv\Scripts\python.exe D:/python_project/Test01/CompareTest.py
arr1的长度为: 5000001
arr2的长度为: 5000001
++++++++++++++++++++++++++++++
1_start: 1518180720.871
arr1比arr2多的内容为: 3333334
arr2比arr1多的内容为: 3333334
1_end: 1518180730.1929998
方法1_比对用时为 9.321999788284302
------------------------------
2_start: 1518180730.36
arr1比arr2多的内容为: 3333334
arr2比arr1多的内容为: 3333334
2_end: 1518180731.3630002
方法2_比对用时为 1.003000259399414
Process finished with exit code 0


通过观察运行结果,可以明显的发现方法2要比方法1执行更快更高效.


4.set集合运算:


网络异常,图片无法展示
|


set集合运算.png

相关文章
WK
|
13天前
|
Python
python元组与列表的转换
在 Python 中,元组(tuple)和列表(list)是两种常用的数据结构,它们之间可以相互转换
WK
20 9
|
13天前
|
Python
探索Python中的列表推导式
【10月更文挑战第20天】在编程世界里,时间就是一切。Python的列表推导式是节约时间、简化代码的一大利器。本文将带你深入理解并有效利用这一强大工具,从基础到高级用法,让你的代码更加简洁高效。
|
13天前
|
Python
SciPy 教程 之 SciPy 模块列表 6
SciPy教程之常量模块介绍:涵盖公制、二进制(字节)、质量、角度、时间、长度、压强、体积、速度、温度、能量、功率及力学单位。示例展示了角度单位转换为弧度的几个常用常量。
16 7
|
13天前
|
Python
SciPy 教程 之 SciPy 模块列表 7
`scipy.constants` 模块提供了常用的时间单位转换为秒数的功能。例如,`constants.hour` 返回 3600.0 秒,表示一小时的秒数。其他常用时间单位包括分钟、天、周、年和儒略年。
14 6
|
10天前
|
Python
SciPy 教程 之 SciPy 模块列表 13
SciPy教程之SciPy模块列表13:单位类型。常量模块包含多种单位,如公制、二进制(字节)、质量、角度、时间、长度、压强、体积、速度、温度、能量、功率和力学单位。示例代码展示了如何使用`constants`模块获取零摄氏度对应的开尔文值(273.15)和华氏度与摄氏度的转换系数(0.5556)。
14 1
|
11天前
|
弹性计算 安全 数据处理
Python高手秘籍:列表推导式与Lambda函数的高效应用
列表推导式和Lambda函数是Python中强大的工具。列表推导式允许在一行代码中生成新列表,而Lambda函数则是用于简单操作的匿名函数。通过示例展示了如何使用这些工具进行数据处理和功能实现,包括生成偶数平方、展平二维列表、按长度排序单词等。这些工具在Python编程中具有高度的灵活性和实用性。
|
12天前
|
Python
SciPy 教程 之 SciPy 模块列表 9
SciPy教程之常量模块介绍,涵盖多种单位类型,如公制、质量、角度、时间、长度、压强等。示例展示了如何使用`scipy.constants`模块查询不同压强单位对应的帕斯卡值,包括atm、bar、torr、mmHg和psi。
11 1
|
12天前
|
Python
SciPy 教程 之 SciPy 模块列表 8
SciPy教程之常量模块单位类型介绍。该模块包含多种单位,如公制、质量、角度、时间、长度、压强、体积、速度、温度、能量、功率和力学单位。示例展示了部分长度单位的转换值,例如英寸、英尺、海里等。
13 1
|
12天前
|
C语言 开发者 Python
探索Python中的列表推导式:简洁而强大的工具
【10月更文挑战第21天】在Python的世界里,代码的优雅与效率同样重要。列表推导式(List Comprehensions)作为一种强大而简洁的工具,允许开发者通过一行代码完成对列表的复杂操作。本文将深入探讨列表推导式的使用方法、性能考量以及它如何提升代码的可读性和效率。
|
14天前
|
知识图谱 Python
SciPy 教程 之 SciPy 模块列表 5
本教程介绍SciPy常量模块中的单位类型,涵盖公制、质量、时间、长度等单位。示例代码展示了如何使用`scipy.constants`模块获取不同质量单位的千克值,如公吨、磅、盎司、原子质量单位等。
11 1