Python 2.7.x 和 3.x 版

发布时间:2019-09-23 17:05:45编辑:auto阅读(1611)

    python现在很火,最近花了些时间去了解了一下,最初了解的是2.7.x版本,感觉,从书写上是很不习惯,少了一双大概号,取而代之的是缩进;然后跟kotlin和swift一样省去了每行的分号,象我们这种分号强迫症的人真心的不习惯;还有!True的条件改成not True、while后面可以跟else等等这些,真心不习惯啊!用2.7.x做了几天的测试,基本慢慢算有个了解了,也试着爬了些行业网的数据,感觉这个比PHP写爬虫方便很多。然后昨晚就在家里装了个3.X的版本,很悲催的发现,原来写的有很多的错误,万般无奈的检查之下,发现语句上是没什么问题,只是3.X版本不兼容部分的语句,例如最常用的print,raw_input都不一样了,今天花了些时间查一查,并总结了一下它们的区别。

    print函数

    Python 2中的print语句被Python 3中的print()函数取代,这意味着在Python 3中必须用括号将需要输出的对象括起来。在Python 3中想以Python2的形式不带括号调用print函数时,会触发SyntaxError。
    Python 2

    print 'Python', python_version() 
    print 'Hello, World!'
    print('Hello, World!')
    print "this line", ; print 'more text on the same line'


    Python 2.7.6 

    Hello, World! 

    Hello, World! 

    this line more text on the same line



    python3

    print('Python', python_version()) 
    print('Hello, World!') 
    print("this line,", end="")  
    print(' more text on the same line')

    Python 3.4.1

    Hello, World!

    this line,  more text on the same line


    print 'Hello, World!'

    File "<ipython-input-3-139a7c5835bd>", line 1


    print 'Hello, World!'

    ^

    SyntaxError: invalid syntax



    注意:

    在Python中,带不带括号输出”Hello World”都很正常。但如果在圆括号中同时输出多个对象时,就会创建一个元组,这是因为在Python 2中,print是一个语句,而不是函数调用。

    通过input()解析用户的输入 

    幸运的是,Python 3改进了input()函数,这样该函数就会总是将用户的输入存储为str对象。在Python 2中,为了避免读取非字符串类型会发生的一些危险行为,不得不使用raw_input()代替input()。

    Python 2

    >>> my_input = input('enter a number: ')

    enter a number: 123

    >>> type(my_input)

    <type 'int'>

    >>> my_input = raw_input('enter a number: ')

    enter a number: 123

    >>> type(my_input)

    <type 'str'> 


    Python 3

    >>> my_input = input('enter a number: ')

    enter a number: 123

    >>> type(my_input)

    <class 'str'>

    整数除法

    由于人们常常会忽视Python 3在整数除法上的改动(写错了也不会触发Syntax Error),所以在移植代码或在Python 2中执行Python 3的代码时,需要特别注意这个改动。

    所以,我还是会在Python 3的脚本中尝试用float(3)/2或 3/2.0代替3/2,以此来避免代码在Python 2环境下可能导致的错误(或与之相反,在Python 2脚本中用from __future__ import division来使用Python 3的除法)。

    Python 2

    print 'Python', python_version() 
    print '3 / 2 =', 3 / 2
    print '3 // 2 =', 3 // 2
    print '3 / 2.0 =', 3 / 2.0
    print '3 // 2.0 =', 3 // 2.0

    Python 2.7.6
    3 / 2 = 1
    3 // 2 = 1
    3 / 2.0 = 1.5
    3 // 2.0 = 1.0

    Python 3

    print('Python', python_version()) 
    print('3 / 2 =', 3 / 2)
    print('3 // 2 =', 3 // 2)
    print('3 / 2.0 =', 3 / 2.0)
    print('3 // 2.0 =', 3 // 2.0)

    Python 3.4.1
    3 / 2 = 1.5
    3 // 2 = 1
    3 / 2.0 = 1.5
    3 // 2.0 = 1.0


    __future__模块

    Python 3.x引入了一些与Python 2不兼容的关键字和特性,在Python 2中,可以通过内置的__future__模块导入这些新内容。如果你希望在Python 2环境下写的代码也可以在Python 3.x中运行,那么建议使用__future__模块。例如,如果希望在Python 2中拥有Python 3.x的整数除法行为,可以通过下面的语句导入相应的模块。

    from __future__ import division

    下表列出了__future__中其他可导入的特性:

    特性可选版本强制版本效果
    nested_scopes2.1.0b12.2PEP 227:
    Statically Nested Scopes
    generators2.2.0a12.3PEP 255:
    Simple Generators
    division2.2.0a23.0PEP 238:
    Changing the Division Operator
    absolute_import2.5.0a13.0PEP 328:
    Imports: Multi-Line and Absolute/Relative
    with_statement2.5.0a12.6PEP 343:
    The “with” Statement
    print_function2.6.0a23.0PEP 3105:
    Make print a function
    unicode_literals2.6.0a23.0PEP 3112:
    Bytes literals in Python 3000

    示例:

    from platform import python_version


    Unicode

    Python 2有基于ASCII的str()类型,其可通过单独的unicode()函数转成unicode类型,但没有byte类型。而在Python 3中,终于有了Unicode(utf-8)字符串,以及两个字节类:bytes和bytearrays。

    Python 2

    print type(unicode('this is like a python3 str type'))
    print type(b'byte type does not exist')
    print 'they are really'+b' the same'
    print type(bytearray(b'bytearray oddly does exist though'))

    <type 'unicode'>

    <type 'str'>

    they are really the same

    <type 'bytearray'>


    Python 3

      print('Python', python_version(), end="")

      print(' has', type(b' bytes for storing data'))

      print('and Python', python_version(), end="")

      print(' also has', type(bytearray(b'bytearrays')))

      print 'note that we cannot add a string' + b'bytes for data'


    Python 3.4.1 has <class 'bytes'>

    and Python 3.4.1 also has <class 'bytearray'>

    ---------------------------------------------------------------------------TypeError Traceback (most recent call last)<ipython-input-13-d3e8942ccf81> in <module>()----> 1 'note that we cannot add a string' + b'bytes for data' TypeError: Can't convert 'bytes' object to str implicitly



    比较无序类型

    Python 3中另一个优秀的改动是,如果我们试图比较无序类型,会触发一个TypeError。

    Python 2

    print "[1, 2] > 'foo' = ", [1, 2] > 'foo'
    print "(1, 2) > 'foo' = ", (1, 2) > 'foo'
    print "[1, 2] > (1, 2) = ", [1, 2] > (1, 2)

    [1, 2] > 'foo' = False

    (1, 2) > 'foo' = True
    [1, 2] > (1, 2) = False

    Python 3

    print("[1, 2] > 'foo' = ", [1, 2] > 'foo')
    print("(1, 2) > 'foo' = ", (1, 2) > 'foo')
    print("[1, 2] > (1, 2) = ", [1, 2] > (1, 2))

    ---------------------------------------------------------------------------

    TypeError Traceback (most recent call last)
    <ipython-input-16-a9031729f4a0> in <module>()
    1 print('Python', python_version())
    ----> 2 print("[1, 2] > 'foo' = ", [1, 2] > 'foo')
    3 print("(1, 2) > 'foo' = ", (1, 2) > 'foo')
    4 print("[1, 2] > (1, 2) = ", [1, 2] > (1, 2))
    TypeError: unorderable types: list() > str()


    返回可迭代对象,而不是列表

    在xrange一节中可以看到,某些函数和方法在Python中返回的是可迭代对象,而不像在Python 2中返回列表。

    由于通常对这些对象只遍历一次,所以这种方式会节省很多内存。然而,如果通过生成器来多次迭代这些对象,效率就不高了。

    此时我们的确需要列表对象,可以通过list()函数简单的将可迭代对象转成列表。

    Python 2

    print range(3)
    print type(range(3))

    [0, 1, 2]
    <type 'list'>

    Python 3

    print(range(3))
    print(type(range(3)))
    print(list(range(3)))

    range(0, 3)
    <class 'range'>
    [0, 1, 2]

    下面列出了Python 3中其他不再返回列表的常用函数和方法:

    • zip()

    • map()

    • filter()

    • 字典的.key()方法

    • 字典的.value()方法

    • 字典的.item()方法

    xrange

    在Python 2.x中,经常会用xrange()创建一个可迭代对象,通常出现在“for循环”或“列表/集合/字典推导式”中。这种行为与生成器非常相似(如”惰性求值“),但这里的xrange-iterable无尽的,意味着可能在这个xrange上无限迭代。由于xrange的“惰性求知“特性,如果只需迭代一次(如for循环中),range()通常比xrange()快一些。不过不建议在多次迭代中使用range(),因为range()每次都会在内存中重新生成一个列表。在Python 3中,range()的实现方式与xrange()函数相同,所以就不存在专用的xrange()(在Python 3中使用xrange()会触发NameError)。

    import timeit
       
    n = 10000
    def test_range(n):
         return for i in range(n):
             pass
       
    def test_xrange(n):
         for i in xrange(n):
             pass

    Python 2

    print 'Python', python_version()
       
    print 'ntiming range()'
    %timeit test_range(n)
       
    print 'nntiming xrange()'
    %timeit test_xrange(n)


    Python 2.7.6 
    timing range()
    1000 loops, best of 3: 433 s per loop 
    timing xrange()
    1000 loops, best of 3: 350 s per loop

    Python 3

    print('Python', python_version())
       
    print('ntiming range()')
    %timeit test_range(n)

    Python 3.4.1

    timing range()
    1000 loops, best of 3: 520 s per loop

     print(xrange(10))

    ---------------------------------------------------------------------------NameError Traceback (most recent call last)in ()----> 1 print(xrange(10)) NameError: name 'xrange' is not defined


    Python 3中的range对象中的__contains__方法


    另一个值得一提的是,在Python 3.x中,range有了一个新的__contains__方法。__contains__方法可以有效的加快Python 3.x中整数和布尔型的“查找”速度。

    x = 10000000
    def val_in_range(x, val):
     return val in range(x)
       
    def val_in_xrange(x, val):
     return val in xrange(x)
       
    print('Python', python_version())
    assert(val_in_range(x, x/2) == True)
    assert(val_in_range(x, x//2) == True)
    %timeit val_in_range(x, x/2)
    %timeit val_in_range(x, x//2)


    Python 3.4.1
    1 loops, best of 3: 742 ms per loop
    1000000 loops, best of 3: 1.19 s per loop   

    根据上面的timeit的结果,查找整数比查找浮点数要快大约6万倍。但由于Python 2.x中的range或xrange没有__contains__方法,所以在Python 2中的整数和浮点数的查找速度差别不大。

    print 'Python', python_version()
       
    assert(val_in_xrange(x, x/2.0) == True)
    assert(val_in_xrange(x, x/2) == True)
    assert(val_in_range(x, x/2) == True)
    assert(val_in_range(x, x//2) == True)
    %timeit val_in_xrange(x, x/2.0)
    %timeit val_in_xrange(x, x/2)
    %timeit val_in_range(x, x/2.0)
    %timeit val_in_range(x, x/2)


    Python 2.7.7
    1 loops, best of 3: 285 ms per loop
    1 loops, best of 3: 179 ms per loop
    1 loops, best of 3: 658 ms per loop
    1 loops, best of 3: 556 ms per loop

    下面的代码证明了Python 2.x中没有__contain__方法:

    print('Python', python_version())
    range.__contains__
    
    print('Python', python_version())
    range.__contains__
    
    print('Python', python_version())
    xrange.__contains__


    Python 3.4.1
    <slot wrapper '__contains__' of 'range' objects   


    Python 2.7.7
    ---------------------------------------------------------------------------
    AttributeError Traceback (most recent call last)<ipython-input-7-05327350dafb> in <module>()
    1 print 'Python', python_version()
    ----> 2 range.__contains__ 
    AttributeError: 'builtin_function_or_method' object has no attribute '__contains__'


    Python 2.7.7
    ---------------------------------------------------------------------------AttributeError Traceback (most recent call last)in ()
    print 'Python', python_version()
    ----> 2 xrange.__contains__
    AttributeError: type object 'xrange' has no attribute '__contains__'


    关于Python 2中xrange()与Python 3中range()之间的速度差异的一点说明:

    有读者指出了Python 3中的range()和Python 2中xrange()执行速度有差异。由于这两者的实现方式相同,因此理论上执行速度应该也是相同的。这里的速度差别仅仅是因为Python 3的总体速度就比Python 2慢。

    def test_while():
     i = 0
     while i < 20000:
      i += 1
     return 
     
    print('Python', python_version())
    %timeit test_while()

    Python 3.4.1

    %timeit test_while()
    100 loops, best of 3: 2.68 ms per loop

    print 'Python', python_version()
    %timeit test_while()

    Python 2.7.6
    1000 loops, best of 3: 1.72 ms per loop



    触发异常

    Python 2支持新旧两种异常触发语法,而Python 3只接受带括号的的语法(不然会触发SyntaxError):

    Python 2

    raise IOError,"file error"

    ---------------------------------------------------------------------------
    IOError Traceback (most recent call last)
    <ipython-input-8-25f049caebb0> in <module>()
    ----> 1 raise IOError, "file error"
    IOError: file error

    raise IOError("file error")

    ---------------------------------------------------------------------------
    IOError Traceback (most recent call last)
    <ipython-input-9-6f1c43f525b2> in <module>()
    ----> 1 raise IOError("file error")
    IOError: file error

    Python 3

    raise IOError, "file error"


    File "<ipython-input-10-25f049caebb0>", line 1
    raise IOError, "file error"
    ^
    SyntaxError: invalid syntax
    The proper way to raise an exception in Python 3:


    raise IOError("file error")


    Python 3.4.1
    ---------------------------------------------------------------------------
    OSError Traceback (most recent call last)
    <ipython-input-11-c350544d15da> in <module>()
    1 print('Python', python_version())
    ----> 2 raise IOError("file error") 
    OSError: file error



    异常处理

    Python 3中的异常处理也发生了一点变化。在Python 3中必须使用“as”关键字。

    Python 2

    try:
         let_us_cause_a_NameError
    except NameError, err:
         print err, '--> our error message'


    name 'let_us_cause_a_NameError' is not defined --> our error message


    Python 3

    try:
         let_us_cause_a_NameError
    except NameError as err:
         print(err, '--> our error message')


    name 'let_us_cause_a_NameError' is not defined --> our error message



    next()函数和.next()方法

    由于会经常用到next()(.next())函数(方法),所以还要提到另一个语法改动(实现方面也做了改动):在Python 2.7.5中,函数形式和方法形式都可以使用,而在Python 3中,只能使用next()函数(试图调用.next()方法会触发AttributeError)。

    Python 2

    print 'Python', python_version()
    my_generator = (letter for letter in 'abcdefg')
    next(my_generator)
    my_generator.next()


    Python 2.7.6
    'b'


    Python 3

    print('Python', python_version())
    my_generator = (letter for letter in 'abcdefg')
    next(my_generator)

    Python 3.4.1

    'a'

    my_generator.next()

    ---------------------------------------------------------------------------
    AttributeError Traceback (most recent call last)
    <ipython-input-14-125f388bb61b> in <module>()
    ----> 1 my_generator.next() 
    AttributeError: 'generator' object has no attribute 'next'


    For循环变量与全局命名空间泄漏

    好消息是:在Python 3.x中,for循环中的变量不再会泄漏到全局命名空间中了!

    这是Python 3.x中做的一个改动,在“What's New In Python 3.0”中有如下描述:

    “列表推导不再支持[... for var in item1, item2, ...]这样的语法,使用[... for var in (item1, item2, ...)]代替。还要注意列表推导有不同的语义:现在列表推导更接近list()构造器中的生成器表达式这样的语法糖,特别要注意的是,循环控制变量不会再泄漏到循环周围的空间中了。”

    Python 2

    print 'Python', python_version()
    i = 1
    print 'before: i =', i
    print 'comprehension: ', [i for i in range(5)] 
    print 'after: i =', i


    Python 2.7.6
    before: i = 1
    comprehension: [0, 1, 2, 3, 4]
    after: i = 4


    Python 3

    print('Python', python_version()) 
    i = 1
    print('before: i =', i)
    print('comprehension:', [i for i in range(5)]) 
    print('after: i =', i)


    Python 3.4.1
    before: i = 1
    comprehension: [0, 1, 2, 3, 4]
    after: i = 1


关键字