python线程池(threadpool

发布时间:2019-08-27 08:16:40编辑:auto阅读(2822)

    最近碰到个问题,需要telnet登录上千台机器去取主机名;其中有用户名密码交互部分,有需要延迟的部分,大概一次登录一次到处理完要10s,1000台机器串行处理就需要1000×10s,差不多三个小时,这是很难受的事情;

    之前用thread的start_new_thread方法也可以实现,但是线程数量不好控制,没找到相关的控制线程数量的锁;

    找了下关于python的线程池,找到threadpool这么一个模块,可以满足我的需求,见:

    http://chrisarndt.de/projects/threadpool/

    我下的是版本1.2.2:

    http://chrisarndt.de/projects/threadpool/download/threadpool-1.2.2.tar.bz2

    放到当前目录或者python模块库都行,用法很简单,见:

        Basic usage::  
          
            >>> pool = ThreadPool(poolsize)  
            >>> requests = makeRequests(some_callable, list_of_args, callback)  
            >>> [pool.putRequest(req) for req in requests]  
            >>> pool.wait()  

    第一行定义了一个线程池,表示最多可以创建poolsize这么多线程;

    第二行是调用makeRequests创建了要开启多线程的函数,以及函数相关参数和回调函数,其中回调函数可以不写,default是无,也就是说makeRequests只需要2个参数就可以运行;

    第三行用法比较奇怪,是将所有要运行多线程的请求扔进线程池,[pool.putRequest(req) for req in requests]等同于:

        for req in requests:  
            pool.putRequest(req)  
    第四行是等待所有的线程完成工作后退出;

    下面看下我的代码,使用线程池前后代码对比,不使用线程池:

        import telnetlib  
        import time  
          
        #执行比较耗时的函数,需要开启多线程  
        def myTelnet(L):  
            tn = telnetlib.Telnet(L[0])  
            time.sleep(2)  
            ...  
            idx = tn.expect(["Username:", "login:"], timeout=5)  
            ...  
            time.sleep(3)  
            x = tn.read_very_eager()  
            tn.close()  
            ...  
            return  
          
        #模拟255个ip,需要逐个登录的函数  
        def myIpPool(ipPrefix):  
            List=[]  
            for i in range(1, 255):  
                List.append("%s.%d" % (ipPrefix, i))  
            return List  
          
        #串行运行telnet登录  
        L=myIpPool("200.200.200")  
        for i in range(len(L)):  
            myTelnet(L[i])  
    如果myTelnet每次执行要10s,那么255次myTelnet就需要2550s,大概是40分钟;

    用多线程的情况:

        import telnetlib  
        import time  
        import threadpool  
          
        #执行比较耗时的函数,需要开启多线程  
        def myTelnet(L):  
            tn = telnetlib.Telnet(L[0])  
            time.sleep(2)  
            ...  
            idx = tn.expect(["Username:", "login:"], timeout=5)  
            ...  
            time.sleep(3)  
            x = tn.read_very_eager()  
            tn.close()  
            ...  
            return  
          
        #模拟255个ip,需要逐个登录的函数  
        def myIpPool(ipPrefix):  
            List=[]  
            for i in range(1, 255):  
                List.append("%s.%d" % (ipPrefix, i))  
            return List  
          
              
        #使用多线程执行telnet函数  
        pool = threadpool.ThreadPool(10)  
        requests = threadpool.makeRequests(myTelnet, L)  
        [pool.putRequest(req) for req in requests]  
        pool.wait()  
        output.close()  
    开始是个线程,理论上应该快10倍,实际可能没这么快,我将myTelnet函数改成只的sleep 10秒,什么也不干,测了下执行完需要260s,几乎是10倍的速度;改成如下:

        pool = threadpool.ThreadPool(30)  
    90s执行完毕,说明线程池还是很有用的东西



关键字