第七天-数据池/常量池 编码补充

发布时间:2019-03-22 21:44:33编辑:auto阅读(1624)

     

     

    小数据池/常量池(坑,别纠结) :

      小数据池 一种数据缓存机制.也被称为驻留机制 

      用缓存的前提: 数据可以被共享。不可变数据类型

      作用/意义:把数据存在小数据池 快速创建对象 共享 节省内存 解释字符串赋值问题等

      python中只针对:整数,字符串串,布尔值    注意共享的是不可改变的数据类型

     

      id()  is  ==

     1 # id() 查看一个变量表示的值的内存地址
     2 a = 1000
     3 b = 1000
     4 c = "lijie"
     5 print(id(a)) # 2602674608112  内存地址
     6 print(id(b)) # 2602674608112
     7 print(id(c)) #  2602703864248
     8 
     9 # == 判断左右两边的值是否一致
    10 print(a == b)  # 判断左右两边的值
    11 print(a == c)
    12 
    13 # is 判断左右两边的内容地址是否一致
    14 print(a is b)  # 判断左右两边内容地址
    15 print(b is c)

     

      缓存

      为什么有缓存 数据保存安全 速度快 加大吞吐量 分布式 异地部署(如 Google无盘数据中心)

      单纯的创建变量。都是有缓存的

    1 # 单纯的创建变量。都是有缓存的
    2 a = 49876
    3 b = 49876
    4 print(a is b)  # True
    5 a = 49786*20
    6 b = 49786*20
    7 print(a is b) # True

      注意 在命令行中(command模式) 小数据池 int取值范围在[-5,256]

    1 # 注意 在命令行中(command模式) 小数据池 int取值范围在[-5,256]
    2 a = 2000
    3 b = 2000
    4 print(a is b) # 在py文件里面是True

      但在命令行中:

      原因: 在代码块内的缓存机制是不一样的 故在py文件里面是True 在command模式中是False

     

    数据池不必纠结,了解会用就好,官方也没详细解释。

     

    编码 转码:

      python3中使用的是unicode,python2中使用的是ascii码,但unicode 太长适合计算不适合存储. utf-8适合存储和传输.因此需要用用到编码转换.

      编码:  .encode()   

      注意编码和解码时都需要制定编码格式.

     1 #.encode()  
     2 s = "嘿en哈"
     3 s0 = "JJ"
     4 bs = s.encode("utf-8") # 制定utf-8格式
     5 bs0 = s0.encode("utf-8")
     6 # 英文编码之后结果和源字符串一致.中文编码之后的结果根据编码不同.编码结果不同.
     7 print(bs0) # b'JJ' 英文编码后和原来一致
     8 print(bs)  # b'\xe5\x98\xbfen\xe5\x93\x88'  一个中文utf-8三字节
     9 bs0 = s0.encode("gbk")
    10 bs = s.encode("gbk")
    11 print(bs0) # b'JJ'
    12 print(bs) # b'\xba\xd9en\xb9\xfe'  一个中文gbk 两字节

      解码:.decode()

    1 j = b'\xba\xd9en\xb9\xfe'
    2 j1 = j.decode("gbk")
    3 print(j1)

      编码:存储和传输时 encode()

      解码:接收数据时 decode()

      b'xxxxx'这种格式的数据是bytes类型的数据  bytes是python中的最小数据单元

      数据传输(包括文字/图片/视频)都是bytes(如直播)————流程:编码——推流——解码——用户

     

    1 # 练习 把一个utf-8编码变成GBK编码
    2 bm = b'\xe5\x98\xbfen\xe5\x93\x88'
    3 
    4 bm0 = bm.decode() # 先解码成Unicode
    5 bm1 = bm0.encode("gbk") # 再编码成gbk
    6 print(bm1)

     

关键字