Python 学习笔记- hashlib模块

简介:

Python里面可以通过hashlib来加密文件。hashlib可以支持多种加密,以最常见的md5为例,我们可以用来加密用户的输入密码,然后保存在数据库里。


例1 加密字符串

1
2
3
4
5
6
7
8
9
10
11
12
13
import  hashlib
obj  =  hashlib.md5(bytes( '1111' , encoding = 'utf-8' ))
obj = hashlib.md5()
obj.update(bytes( '123' , encoding = 'utf8' ))
obj.update(bytes( '456' ,encoding = 'utf8' ))
result  =  obj.hexdigest()
print (obj)
print (obj.digest())
print (result)
- - - - - - - - - - - - - - - -
<md5  HASH  object  0x101d839b0 >
b '\xe1\n\xdc9I\xbaY\xab\xbeV\xe0W\xf2\x0f\x88>'
e10adc3949ba59abbe56e057f20f883e


值得注意的有几点:

  1. 首先通过hashlib.md5()生成一个对象;然后调用这个对象的方法update去生成对应的md5 checksum,然后打印出来;

  2. 我对字符串‘123’,‘456’的字节分别执行了update的操作,那么最后他的md5结果和‘123456’的字节其实是一样的。通过类似的方法,我们可以把一个很大的文件分字节的读入。

  3. hexdigest()和digest()的区别 前者输出的是2进制 后者是一个16进制的摘要

  4. 因为md5可以通过撞库来破解,因此可以通过 obj=hashlib.md5(bytes('111',encoding='utf8))再加一次密,这样撞库的几率就大为降低了。


例2 加密文件

1
2
3
4
5
6
7
8
9
10
11
import  hashlib
def  md5(fname):
     hash_md5  =  hashlib.md5()
     with  open (fname,  "rb" ) as f:
         for  chunk  in  iter ( lambda : f.read( 4096 ), b""):
             hash_md5.update(chunk)
     return  hash_md5.hexdigest()
dd = md5( 'index.py' )
print (dd)
- - - - - - - - - - - - - - - - - - - - - - -
06fd2a2b98ff2e333bc9861dfb8048de

注意事项:

因为文件可能很大,所以每次只读取4096个字节进行转换。最后返回最终的md5 checksum。

注意这一句 iter()的使用,第一个参数是返回的f.read(4096)个字节码的迭代器,第二个参数b"" 表示直到这个参数才迭代结束,换句话说相当于一个循环,每次读取4096个字节码,直到为空

1
for  chunk  in  iter ( lambda : f.read( 4096 ), b"")


最后的MD5结果和我直接在OSX Shell里面操作是一样的

1
2
jip-ise:week6 yli$ md5 index.py 
MD5 (index.py) = 06fd2a2b98ff2e333bc9861dfb8048de






本文转自 beanxyz 51CTO博客,原文链接:http://blog.51cto.com/beanxyz/1854933,如需转载请自行联系原作者

目录
相关文章
|
14天前
|
存储 开发者 Python
Python中的collections模块与UserDict:用户自定义字典详解
【4月更文挑战第2天】在Python中,`collections.UserDict`是用于创建自定义字典行为的基类,它提供了一个可扩展的接口。通过继承`UserDict`,可以轻松添加或修改字典功能,如在`__init__`和`__setitem__`等方法中插入自定义逻辑。使用`UserDict`有助于保持代码可读性和可维护性,而不是直接继承内置的`dict`。例如,可以创建一个`LoggingDict`类,在设置键值对时记录操作。这样,开发者可以根据具体需求定制字典行为,同时保持对字典内部管理的抽象。
|
16天前
|
存储 C语言 Python
【Python】学习笔记day3
【Python】学习笔记day3
26 1
|
15天前
|
存储 缓存 算法
Python中collections模块的deque双端队列:深入解析与应用
在Python的`collections`模块中,`deque`(双端队列)是一个线程安全、快速添加和删除元素的双端队列数据类型。它支持从队列的两端添加和弹出元素,提供了比列表更高的效率,特别是在处理大型数据集时。本文将详细解析`deque`的原理、使用方法以及它在各种场景中的应用。
|
1天前
|
Python
python学习14-模块与包
python学习14-模块与包
|
2天前
|
SQL 关系型数据库 数据库
Python中SQLite数据库操作详解:利用sqlite3模块
【4月更文挑战第13天】在Python编程中,SQLite数据库是一个轻量级的关系型数据库管理系统,它包含在一个单一的文件内,不需要一个单独的服务器进程或操作系统级别的配置。由于其简单易用和高效性,SQLite经常作为应用程序的本地数据库解决方案。Python的内置sqlite3模块提供了与SQLite数据库交互的接口,使得在Python中操作SQLite数据库变得非常容易。
|
7天前
|
索引 Python
「Python系列」Python operator模块、math模块
Python的`operator`模块提供了一系列内置的操作符函数,这些函数对应于Python语言中的内建操作符。使用`operator`模块可以使代码更加清晰和易读,同时也能提高性能,因为它通常比使用Python内建操作符更快。
25 0
|
12天前
|
数据采集 网络协议 API
python中其他网络相关的模块和库简介
【4月更文挑战第4天】Python网络编程有多个流行模块和库,如requests提供简洁的HTTP客户端API,支持多种HTTP方法和自动处理复杂功能;Scrapy是高效的网络爬虫框架,适用于数据挖掘和自动化测试;aiohttp基于asyncio的异步HTTP库,用于构建高性能Web应用;Twisted是事件驱动的网络引擎,支持多种协议和异步编程;Flask和Django分别是轻量级和全栈Web框架,方便构建不同规模的Web应用。这些工具使网络编程更简单和高效。
|
15天前
|
数据采集 数据挖掘 Python
Python中collections模块的Counter计数器:深入解析与应用
在Python的`collections`模块中,`Counter`是一个强大且实用的工具,它主要用于计数可哈希对象。无论是统计单词出现的频率,还是分析数据集中元素的分布情况,`Counter`都能提供快速且直观的结果。本文将深入解析`Counter`计数器的原理、用法以及它在实际应用中的价值。
|
16天前
|
Python
Python中的math和cmath模块:数学运算的得力助手
Python作为一种功能强大的编程语言,提供了丰富的数学运算功能。其中,math和cmath模块就是Python中用于数学运算的重要工具。math模块提供了基本的数学函数和常量,适用于实数运算;而cmath模块则提供了对复数运算的支持,使得Python在数学计算和工程应用中更加灵活和强大。
|
19天前
|
数据挖掘 Python
Python中的datetime模块:轻松拿捏时间操作
Python的`datetime`模块是处理日期和时间的核心工具,包括`date`、`time`、`datetime`、`timedelta`类。它可以创建、操作和格式化日期时间。
18 2