小数据池/常量池(坑,别纠结) :
小数据池 一种数据缓存机制.也被称为驻留机制
用缓存的前提: 数据可以被共享。不可变数据类型
作用/意义:把数据存在小数据池 快速创建对象 共享 节省内存 解释字符串赋值问题等
python中只针对:整数,字符串串,布尔值 注意共享的是不可改变的数据类型
id() is ==
1 # id() 查看一个变量表示的值的内存地址 2 a = 1000 3 b = 1000 4 c = "lijie" 5 print(id(a)) # 2602674608112 内存地址 6 print(id(b)) # 2602674608112 7 print(id(c)) # 2602703864248 8 9 # == 判断左右两边的值是否一致 10 print(a == b) # 判断左右两边的值 11 print(a == c) 12 13 # is 判断左右两边的内容地址是否一致 14 print(a is b) # 判断左右两边内容地址 15 print(b is c)
缓存
为什么有缓存 数据保存安全 速度快 加大吞吐量 分布式 异地部署(如 Google无盘数据中心)
单纯的创建变量。都是有缓存的
1 # 单纯的创建变量。都是有缓存的 2 a = 49876 3 b = 49876 4 print(a is b) # True 5 a = 49786*20 6 b = 49786*20 7 print(a is b) # True
注意 在命令行中(command模式) 小数据池 int取值范围在[-5,256]
1 # 注意 在命令行中(command模式) 小数据池 int取值范围在[-5,256] 2 a = 2000 3 b = 2000 4 print(a is b) # 在py文件里面是True
但在命令行中:
原因: 在代码块内的缓存机制是不一样的 故在py文件里面是True 在command模式中是False
数据池不必纠结,了解会用就好,官方也没详细解释。
编码 转码:
python3中使用的是unicode,python2中使用的是ascii码,但unicode 太长适合计算不适合存储. utf-8适合存储和传输.因此需要用用到编码转换.
编码: .encode()
注意编码和解码时都需要制定编码格式.
1 #.encode() 2 s = "嘿en哈" 3 s0 = "JJ" 4 bs = s.encode("utf-8") # 制定utf-8格式 5 bs0 = s0.encode("utf-8") 6 # 英文编码之后结果和源字符串一致.中文编码之后的结果根据编码不同.编码结果不同. 7 print(bs0) # b'JJ' 英文编码后和原来一致 8 print(bs) # b'\xe5\x98\xbfen\xe5\x93\x88' 一个中文utf-8三字节 9 bs0 = s0.encode("gbk") 10 bs = s.encode("gbk") 11 print(bs0) # b'JJ' 12 print(bs) # b'\xba\xd9en\xb9\xfe' 一个中文gbk 两字节
解码:.decode()
1 j = b'\xba\xd9en\xb9\xfe' 2 j1 = j.decode("gbk") 3 print(j1)
编码:存储和传输时 encode()
解码:接收数据时 decode()
b'xxxxx'这种格式的数据是bytes类型的数据 bytes是python中的最小数据单元
数据传输(包括文字/图片/视频)都是bytes(如直播)————流程:编码——推流——解码——用户
1 # 练习 把一个utf-8编码变成GBK编码 2 bm = b'\xe5\x98\xbfen\xe5\x93\x88' 3 4 bm0 = bm.decode() # 先解码成Unicode 5 bm1 = bm0.encode("gbk") # 再编码成gbk 6 print(bm1)