python抓取某个网站的教学视频下载并

发布时间:2019-08-27 08:03:41编辑:auto阅读(1754)

     

    1. #!/usr/bin/python 
    2. # -*- coding: utf-8 -*- 
    3.  
    4. import urllib,re 
    5.  
    6. url1 = 'http://www.csvt.net/resource/videos' 
    7. headers = ('User-Agent','Mozilla/5.0 (Windows NT 5.1; rv:14.0) Gecko/20100101 Firefox/14.0.1'
    8. opener.addheaders = [headers] 
    9. data = urllib.urlopen(url1).read() 
    10. data = data.decode('utf8'
    11. downurl = re.findall(re.compile(r'file=(.*)&dis'),data) 
    12. name=re.findall(r'largesize" target="_blank">(.*)</a>',data) 
    13. file=open('downurl.txt','w'
    14. for i in range(len(downurl)): 
    15.     print  name[i]+" "+"http://csvt-course.b0.upaiyun.com"+downurl[i] 
    16.     #rllib.urlretrieve("http://csvt-course.b0.upaiyun.com"+downurl[i],name[i]+'.flv') #download file 
    17.     url="http://csvt-course.b0.upaiyun.com"+downurl[i] 
    18.     file.write(url+'\n'
    19.     print '-'*100 
    20. file.close() 
    21.  
    22. for i1 in range(len(downurl)): 
    23.     print 'download files ing..............................................' 
    24.     rllib.urlretrieve("http://csvt-course.b0.upaiyun.com"+downurl[i],name[i]+'.flv'
    25.      

     

关键字