Python学习-hashlib

发布时间:2019-07-23 09:41:52编辑:auto阅读(1309)

    Python的hashlib提供了常见的摘要算法,主要提供 SHA1, SHA224, SHA256, SHA384, SHA512 ,MD5 算法。

    摘要算法又称哈希算法、散列算法。它通过一个函数,把任意长度的数据转换为一个长度固定的数据串(通常用16进制的字符串表示)。

    以常见的摘要算法MD5为例,计算出一个字符串的MD5值:

    import hashlib
    
    MD5 = hashlib.md5()
    MD5.update(bytes('how to use md5 in python hashlib?',encoding='utf-8'))
    print(MD5.hexdigest())
    
    
    d26a53750bc40b38b65a520292f69306

    如果数据量很大,可以分块多次调用update(),最后计算的结果是一样的:

    import hashlib
    
    MD5 = hashlib.md5()
    MD5.update(bytes('how to use md5 in ',encoding='utf-8'))
    MD5.update(bytes('python hashlib?',encoding'utf-8'))
    print(MD5.hexdigest())

    改动一个字母,看看计算的结果是否完全不同。


    MD5是最常见的摘要算法,速度很快,生成结果是固定的128 bit字节,通常用一个32位的16进制字符串表示。另一种常见的摘要算法是SHA1,调用SHA1和调用MD5完全类似:

    import hashlib
    
    SHA1 = hashlib.sha1()
    SHA1.update(bytes('how to use sha1 in ',encoding='utf-8'))
    SHA1.update(bytes('python hashlib?',encoding='utf-8'))
    print(SHA1.hexdigest())

    SHA1的结果是160 bit字节,通常用一个40位的16进制字符串表示。

    比SHA1更安全的算法是SHA256和SHA512,不过越安全的算法不仅越慢,而且摘要长度更长。

    以上加密算法虽然依然非常厉害,但时候存在缺陷,即:通过撞库可以反解。所以,有必要对加密算法中添加自定义key再来做加密。

    import hashlib
    
    hash = hashlib.md5(bytes('898oaFs09f',encoding="utf-8"))
    hash.update(bytes('admin',encoding="utf-8"))
    print(hash.hexdigest())


    摘要算法应用

    任何允许用户登录的网站都会存储用户登录的用户名和口令。如何存储用户名和口令呢?方法是存到数据库表中:

    name    | password
    --------+----------
    michael | asddasda
    lzj     | ddecewad
    erics   | se232cw3

    以明文保存用户口令,如果数据库泄露,所有用户的口令就落入***的手里;正确的保存口令的方式是不存储用户的明文口令,而是存储用户口令的摘要,比如MD5:

    username | password
    ---------+---------------------------------
    michael  | e10adc3949ba59abbe56e057f20f883e
    lzj      | 878ef96e86145580c38c87f0410ad153
    erics    | 99b1c2188db85afee403b1536010c2c9

    当用户登录时,首先计算用户输入的明文口令的MD5,然后和数据库存储的MD5对比,如果一致,说明口令输入正确,如果不一致,口令肯定错误。

关键字