Python中可选的环境变量设置,Pyt

发布时间:2019-09-03 08:55:16编辑:auto阅读(2381)


    好记性不如烂笔头,看到Python Optional Variables这一块,把学习的东西记录下来



    一. 可选的环境变量设置

    会写Java Hello World的同学一定知道如何设置环境变量,比如:JAVA_HOME,CLASSPATH等。


    Python中也一样有类似的环境变量,有一些还是可选的(比如:PYTHONPATH, PYTHONSTARTUP等)

    1. 设置PYTHONPATH

    这个环境变量有什么用呢?

    我们知道在导入模块时(比如:import some_module_name),Python需要在某些路径(即sys.path这个列表中的路径)中去寻找相应的模块,而PYTHONPATH这个变量就是告诉Python,将它的值也加入到搜索路径中(即将PYTHONPATH的值合并到sys.path列表中)。

    export PYTHONPATH=/tmp
    python -c "import sys; print 'found' if '/tmp' in sys.path else '' "

    输出结果是:found

    说明/tmp在sys.path中被找到了(即/tmp附加到了sys.path中)


    2. 设置PYTHONSTARTUP

    如果这个环境变量的值是一个可读的文件,那么该文件中的Python命令会在交互模式启动之前执行。

    echo "print 'hello world'" > /tmp/a.py
    export PYTHONSTARTUP=/tmp/a.py
    python

    在启动python交互模式后,会看到有hello world已经被输出了。


    3. 设置PYTHONHOME

    一般在这个变量没有被设置的情况下,Python中的sys.path会列出一些模块的搜索路径。

    # 比如:
    ['', '/usr/lib/python2.7', '/usr/lib/python2.7/plat-linux2', 
    '/usr/lib/python2.7/lib-tk', '/usr/lib/python2.7/lib-old', 
    '/usr/lib/python2.7/lib-dynload', '/usr/local/lib/python2.7/dist-packages', 
    '/usr/lib/python2.7/dist-packages']

    Python模块的搜索路径一般默认是sys.prefix/lib,可以看到很多路径是 /usr/lib/... 这种,其中/usr 就是sys.prefix这个变量的值(windows上可能是你安装Python的目录,比如: C:\Python2.7)。

    如果人工指定了PYTHONHOME,那么sys.prefix的值就会被替换。


    随便替换PYTHONHOME的值,可能造成Python无法启动,替换前请备份sys.prefix的值



    4. 设置PYTHONCASEOK

    这个变量只对Windows起效,可以设置为任意的值(比如:SET PYTHONCASEOK=OK)

    设置了以后,Python对模块的导入,将忽略大小写(只对用户module忽略大小写,对built-in module还是大小写敏感)



    5. 设置PYTHONIOENCODING

    看这个名字,IO Encoding可以猜到这个东西是和输入输出有关的。对,这个环境变量的作用就是指定Python程序标准输入输出(stdin,stdout,stderr)的编码。

    关于这个东西的运用,请参考:http://www.soimort.org/posts/118/  太长不看 :D


    再补充一些关于encode和decode的要点:

    在Python 2.x中,str类型的字符串,都是指string of bytes(二进制流的表示形式),一般来说

    1). '...'.decode([encoding_name])是将string of bytes转化成unicode string

    运用场景是,从网络或者文件中读取了二进制流,然后将其转化为unicode字符串,便于阅读。


    2). u'....'.encode([encoding_name])是将unicode string转化成string of bytes

    运用场景是,将unicode字符串转化成二进制流(Java的叫法也称为字节流),然后推向网络或者文件中。


    另外,还有两个方法,str.encode和unicode.decode,这两个方法意义不大(几乎很少运用)

    "...".encode() 会先默认隐式的用default encoding去decode,即调用"...".decode(sys.getdefaultencoding()) ,然后再继续调用"...".encode()



    而u"...".decode()也会先默认隐式的调用u"...".encode(sys.getdefaultencoding()),然后继续调用u"...".decode()



    二. 使用pdb模块调试、跟踪脚本

    有些时候,需要在没有IDE帮助的情况下,对脚本的运行情况进行调试、跟踪,可以使用Python内置的pdb模块(参考:https://docs.python.org/2/library/pdb.html)

    一个简单的例子:

    对脚本test.py进行跟踪调试

    #! /usr/bin/env python
    
    def foo():
        s = 0
        for i in range(3):
            s += i
        print s
    
    
    if __name__ == "__main__":
        foo()

    运行命令:

    python -m pdb test.py

    显示类似如下所示:

    > /tmp/test.py(3)<module>()
    -> def foo():
    (Pdb) l
      1      #! /usr/bin/env python
      2      
      3  ->    def foo():
      4          s = 0
      5          for i in range(3):
      6              s += i
      7          print s
      8      
      9      
     10      if __name__ == "__main__":
     11          foo()
    (Pdb) n
    > /tmp/test.py(10)<module>()
    -> if __name__ == "__main__":
    (Pdb)


    (pdb)是调试提示符,在提示符下可以输入命令(具体参考文档

    可以在(pdb)提示符下,查看标量的值,可以使用print 语句打印


    常用的简单命令有:

    命令全称
    简写
    命令描述

    list
    l
    列出当前执行脚本的内容(其中有箭头标注当前执行到的位置)

    next
    n
    执行下一步,遇到函数不进入其内部。(相当于IDE中的step over)

    step
    s
    执行下一步,遇到函数进入其内部。(相当于IDE中的step into)

    break
    b

    设置断点,如果不带参数,则列出当前执行脚本中的所有断点(号)。


    也可以带参数,比如,执行: b 6)代表在脚本的第6行设置断点,如右边所示,它的断点号是1。

    (Pdb) b 6
    Breakpoint 1 at /tmp/test.py:6
    (Pdb) l
      5          for i in range(3):
      6 B            s += i
      7          print s
      8      
      9      
     10  ->    if __name__ == "__main__":
     11          foo()
    clear
    cl

    清除脚本中的断点。

    1)不带参数,会询问是否清除脚本中的所有断点


    2)带参数会清除指定的断点。(注意清除的格式)


    • cl(ear) [filename:lineno | bpnumber [bpnumber ...]]

      With a filename:lineno argument, clear all the breakpoints at this line. With a space separated list of breakpoint numbers, clear those breakpoints. Without argument, clear all breaks (but first ask confirmation).


    所以,要清除上面设置的第6行的断点,要么使用  cl 1  (清除断点号是1的断点);要么使用  cl test.py:6 (清除test.py中的第6行)


    使用 cl 6是错误的,因为目前为止,没有标号是6的断点!!

    continue
    c
    继续执行脚本,直到遇到断点停止。

    quit
    q
    退出调试




    That's it!w_0050.gif

关键字