Python内置数据结构——bytes,

发布时间:2019-09-07 08:11:32编辑:auto阅读(1573)

    bytes,bytearray

    字符串与bytes

    • 字符串是字符组成的有序序列,字符可以使用编码来理解

    • bytes是字节组成的有序的不可变序列

    • bytesarray是字节组成的有序的可变序列

    编码与解码

    • 字符串按照不同的字符集编码encode返回字序列bytes

                bytes.encode(encoding = 'utf - 8',errors = 'stirct') -> bytes

    • 字节序列按照不同的字符集解码decode 返回字符串

                bytes.decode(encoding = "utf - 8",errors = "strict") -> str

                bytearray.decode(encoding ="utf - 8",errors = "strict" ) -> str

    ASCII

                ASCII(American Standard Code for information Interchange,美国信息交换标准代码)是基于拉丁字母的一套单字节编码系统

    bytes定义

    • bytes() 空bytes

    • bytes(int) 指定字节bytes,被0填充

    • bytes(iterable_of_ints) -> bytes[0~255] 的int组成的可迭代对象

    • bytes(string,encodeing[,errors]) -> bytes  等价于string.encode()

    • bytes(bytes_or_buffer) -> immutable copy of bytes_or_buffer从一个字节序列或者buffer复制出一个新的额不可变的bytes对象

    • 使用b 前缀定义

                只允许基本ASCII使用字符形式 b'abc9'

                使用16进制表示b'\x41\x61'

    bytes操作

    • 和str类型类似,都是不可变类型,所以犯法很多都一样,只不过bytes的方法,输入是bytes,输出是bytes

      • b'abcdef'.replace(b'f',b'k')

      • b'abc'.find(b'b')

    • 类方法 bytes.fromhex(string)

      • string必须是2 个字符的16进制的形式,"6162 6a 6b", 空格将被忽略

      • bytes.fromhex("6162 09 6a 6b00")

    • hex()

      • 返回16 进制表示的字符串

      • "abc".encode().hex()

    • 索引

      • b.'abcdef'[2] 返回该字节对应的数,int类型

    bytearray定义

    定义:

    • bytearray()空bytearray

    • bytearray(int) 指定字节的bytearray, 被0 填充

    • bytearray(iterable_of_ints) -> bytearray  [0,255]的int组成的可迭代对象

    • bytearray(string,encoding[,errors]) -> bytearry 近似string.encode() ,不过返回可变对象

    • bytearray(bytes_or_buffer)从一个字节序列或者buffer复制出一个新的可变的bytearray对象

    注意:b前缀定义的类型是bytes类型

    bytearray操作

    • 和bytes类型的方法相同

      • bytearray(b'abcdef').replace(b'f',b'k')

      • bytearray(b'abc').find(b'b')

    • 类方法 bytearray.fromhex(string)

      • string必须是2 个字符的16进制的形式,‘6162 6a 6b’,空格将被忽略

      • bytearray.fromhex('6162 09 6a 6b00')

    • hex()

      • 返回16 进制表示的字符串

      • bytearray('abc'.encode()).hex()

    • 索引

      • bytearray(b'abcdef')[2] 返回该字节对应的数,in类型


    • .append(int)尾部追加一个元素

    • .insert(index,int)在指定索引位置插入元素

    • .extend(iterable_of_ints) 讲一个可迭代的整数集合追加到当前bytearray

    • .pop(index = -1)从指定索引上移除元素,默认从尾部移除

    • .remove(value)找到第一个value移除,找不到抛value error

    注意: 上述方法若需要使用int类型,值在[0,255]

    • .clear() 清空bytearray

    • .reverse()翻转bytearray ,就地修改

    int 和 bytes 之间转换

    • int.from_bytes(bytes,byteorder)

      • 将以个字节数组表示成整数

    • int.to_bytes(length, byteorder)

      • byteorder 指字节序(大端big)

      • 将一个整数表达成一个指定长度的字节数组

    i = int.form_bytes(b.'abc', 'big')
    print( i , hex()) # 6382179  0x616263
    printn(i.to_bytes(3 , 'big')) # b'abc'


    所有数据在内存中全部都是2进制的形式,人要理解一个内存中的数据必须先要指定它的类型,否则这个数据是没有意义的

    一个字节 = 8位

    一个字节0~255

    两个字节0~65535

    0~255

    0~127


    大小端的意思是在内存中数据是如何存放的 (大小端代表着高低字节)例如:如果给两个字节ab 是a放高地址呢还是b放高地址呢

    低字节放在高地址上,大端模式big

    低字节放在小地址上,小端模式little

    高低字节的排放顺序~~~

    网络上采用大端模式

    windows内部采用小端模式

    mac用大端模式



关键字