-
auto
2019-04-22 22:10:29
python
1655°
20
在shell脚本中,常用if来判断程序的某个部分是否可能会出错,并在if的分支中做出对应的处理,从而让程序更具健壮性。if判断是异常处理的一种方式,所有语言都通用。对于特性完整的编程语言来说,都有专门的异常处理机制,有些语言用起来可能会很复杂,要求一堆堆的,有些语言则非常简洁,用起来非常通畅。 入门 ...
-
auto
2019-04-22 22:10:29
python
2205°
20
1.昨日的补充 reversed 翻转, 将一个序列翻转,返回翻转序列的迭代器 lst = ["河南话", "四川话", "东北", "山东", "上海"] n = reversed(lst) print(list(n)) lst = ["河南话", "四川话", "东北", "山东", "上海"] ...
-
auto
2019-04-22 22:10:29
python
3558°
20
概述 Python 中可以读取 word 文件的库有 python-docx 和 pywin32。 下表比较了各自的优缺点。 优点缺点 python-docx 跨平台 只能处理 .docx 格式,不能处理.doc格式 pywin32 仅限 windows 平台 .doc 和 .docx 都能处理 p ...
-
auto
2019-04-22 22:10:29
python
1595°
20
美空网数据 简介 从今天开始,我们尝试用2篇博客的内容量,搞定一个网站叫做“美空网”网址为:http://www.moko.cc/, 这个网站我分析了一下,我们要爬取的图片在 下面这个网址 http://www.moko.cc/post/1302075.html 然后在去分析一下,我需要找到一个图片 ...
-
auto
2019-04-22 22:10:29
python
2110°
20
一. Python程序中, 文件的处理步骤是什么? 二. 文本打开时设置的模式有哪些? 分别代表什么意思? 三. os模块中提供的常用文件操作? 四. 代码实现: 大文件拷贝操作 注意: 不能一次性读取大文件内容, 容易造成内存峰值 五. 代码实现: 假设一个文件夹中有很多不同格式的文件, 要求: ...
-
auto
2019-04-22 22:10:29
python
1614°
20
最近在使用爬虫爬取数据时,经常会返回403代码,大致意思是该IP访问过于频繁,被限制访问。限制IP访问网站最常用的反爬手段了,其实破解也很容易,就是在爬取网站是使用代理即可,这个IP被限制了,就使用其他的IP。对于高大上的公司来说,他们基本都使用收费的代理,基本不会有什么问题,比较稳定。像我这样的矮 ...
-
auto
2019-04-22 22:10:29
python
2173°
20
1 # python3中的 str 和 byte(即二进制)转换 2 msg = "β" 3 # 转换为二进制,打印,‘encoding = 'utf-8'为值定转换原str的编码格式’ 4 print(msg.encode(encoding='utf-8')) 5 # 由二进制转回str编码 6 ... ...
-
auto
2019-04-22 22:10:29
python
2738°
20
AlphaZero Gomoku MPI Link Github : "AlphaZero Gomoku MPI" Overview This repo is based on "junxiaosong/AlphaZero_Gomoku" , sincerely grateful for it. I ...
-
auto
2019-04-22 22:10:29
python
1657°
20
mysql 创建简单的临时表 tmp create database test; use test; DROP TABLE IF EXISTS ; CREATE TABLE ( int(11) NOT NULL AUTO_INCREMENT, varchar(60) CHARACTER SET ut ...
-
auto
2019-04-22 22:10:29
python
2233°
20
编写qsbk_spider.py爬虫文件 编写items.py文件 编写pipelines.py文件保存数据到duanzi.json文件里 编写start.py爬虫启动文件 设置settings.py文件相关配置 运行start.py文件爬取网站数据并保存到duanzi.json文件里 ...
-
auto
2019-04-22 22:10:29
python
2048°
20
1. 装饰器 遵循的原则: 开闭原则: 对功能的扩展开放 对代码的修改是封闭 2. 带参数的装饰器 3. 同一个函数被多个装饰器装饰 ...
-
auto
2019-04-22 22:10:29
python
2254°
20
函数的装饰器. 1. 装饰器 开闭原则: 对功能的扩展开放 对代码的修改是封闭 通用装饰器语法: 2. 同一个函数被多个装饰器装饰 就近原则 3. 带参数的装饰器 ...
-
auto
2019-04-22 22:10:29
python
2118°
20
Python基础知识(32):网络编程(Ⅰ) 网络通信是两台计算机上的两个进程之间的通信,而网络编程就是如何在程序中实现两台计算机的通信 P协议负责把数据从一台计算机通过网络发送到另一台计算机 TCP协议则是建立在IP协议之上的。TCP协议负责在两台计算机之间建立可靠连接,保证数据包按顺序到达 许多 ...
-
auto
2019-04-22 22:10:29
python
2219°
20
1:创建项目 2:创建爬虫 3:编写start.py文件用于运行爬虫程序 4:设置settings.py文件的相关设置 爬取详情页数据 编写items.py文件 编写js.py 设计数据库和表 数据库jianshu 表article id设置为自动增长 将爬取到的数据存储到mysql数据库中 运行s ...
-
auto
2019-04-22 22:10:29
python
2271°
20
第一部分 Flask简介 前言:想熟练掌握一门web框架,为以后即将诞生的测试工具集做准备。为什么选择flask要做熟练掌握的一门框架,而不是其他的,最主要的原因是可以随意定制。 特别提醒:这本书的代码会提交在github,有基础的人可以直接看github的代码来学习flask。基础差还是建议买书来 ...
-
auto
2019-04-22 22:05:05
python
1999°
20
一、简介 以下引用自百度百科 Matplotlib 是一个 Python 的 2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形 。 通过 Matplotlib,开发者可以仅需要几行代码,便可以生成绘图,直方图,功率谱,条形图,错误图,散点图等。 二、流程 1. 明确要研究的问 ...
-
auto
2019-04-22 22:05:05
python
2080°
20
什么是scrapy? scrapy是一个为了爬去网站数据,提取结构性数据而编写的应用框架,我们只需要实现少量的代码,就能够快速的抓取 scrapy使用了 Twisted 异步网络框架,可以加快我们的下载速度 异步和非阻塞的区别 异步:调用在发布之后,这个调用就直接返回,不管有无结果 非阻塞:关注的是 ...
-
auto
2019-04-22 22:05:05
python
2005°
20
读取文件 假设你已经在某个文件夹下创建了 “test.txt” 文件,且里面有一些内容,那你在当前位置输入 Python3,进入到交互模式,然后执行下面的操作: 这里提醒大家注意一下,如果是在该文件所在的位置启动的 Python 交互模式,那么按照上面的方法 open(‘test.txt’) 打开文 ...
-
auto
2019-04-22 22:05:05
python
2092°
20
简介 你好,当你打开这个文档的时候,我知道,你想要的是什么! Python爬虫,如何快速的学会Python爬虫,是你最期待的事情,可是这个事情应该没有想象中的那么容易,况且你的编程底子还不一定好,这套课程,没有你想要的Python基础,没有变量,循环,数组等基础知识,因为我不想在那些你可以直接快速学 ...
-
auto
2019-04-22 22:05:05
python
1705°
20
妹子图网站爬取 前言 从今天开始就要撸起袖子,直接写Python爬虫了,学习语言最好的办法就是有目的的进行,所以,接下来我将用10+篇的博客,写 这一件事情。希望可以做好。 为了写好爬虫,我们需要准备一个火狐浏览器,还需要准备抓包工具,抓包工具,我使用的是CentOS自带的tcpdump,加上wir ...