Python3 爬取豆瓣书籍 Xpat

发布时间：2019-09-25 08:26:07编辑：auto阅读（2540）

#coding:utf8
import time
from urllib import request
from bs4 import BeautifulSoup
num = 1#用来计算一共爬取了多少本书
start_time = time.time()#定位一个开始的时间

128?page=1'

html = request.urlopen('https://book.douban.com/series/128?page=1')

bsObj = BeautifulSoup(html,'lxml')

print (bsObj)

f = open('/root/桌面/豆瓣/1.txt','a')
for i in range(1,3):
for e in (100,400,15):
html = request.urlopen('https://book.douban.com/series/%d?page=%d'%(e,i))
bsObj = BeautifulSoup(html,'lxml')
print ("=============" + "第%d页"%i + "==============")
h2_list = bsObj.find_all('h2')

print (h2_list)

    for h2_node in h2_list:
        a_node = h2_node.a
        #print (a_node)
        title = a_node.attrs["title"]
        title = "<<" + title + ">>"
        print ("第%d本书籍"%num,title,file=f)
        num +=1
    time.sleep(2)

end_time = time.time()
duration_time = start_time - end_time
print ('运行时间一共%.2f: '%duration_time+'秒')
print ('共抓到%d本书籍'%num-1)
f.close()

关键字：

上一篇： Python3快速入门（十八）——PyI

下一篇： python3的time模块和datet



搜索

热门推荐

最新文章

自定义搭建一个Agent系统
 46°
LLaMA Factory-Lora微调实现声控语音多轮问答对话-1
 706°
LLaMA Factory微调后的模型合并导出和部署-4
 1249°
LLaMA Factory微调模型的各种参数怎么设置-3
 1206°
LLaMA Factory构建高质量数据集-2
 1076°
MinerU-linux环境本地部署
 2184°
LLaMA Factory安装和基本使用-1
 1294°
使用ms-swift基于Qwen3-8B微调小说模型
 1912°
pythonp爬虫-fanqienovel字体反爬实战
 2154°
大模型基础架构
 1672°

博主信息

姓名：Run
职业：谜
邮箱：383697894@qq.com
定位：上海 · 松江

扫我打开

友情链接

百度 淘宝 腾讯 慕课网 CSDN 博客园 51cto博客