-
auto
2019-05-02 06:56:58
python
1830°
20
面向对象:字典实现人狗大战、自定义类、调用类中的方法、类的内容查看、修改、添加、使用类来完成人狗大战 ...
-
auto
2019-05-02 06:56:58
python
2052°
20
Django是Python中一个非常牛逼的web框架,他帮我们做了很多事,里边也提前封装了很多牛逼的功能,用起来简直不要太爽,在写网站的过程中,增删改查这几个基本的功能我们是经常会用到,Django把这系列复杂的逻辑性东西都封装成了方法,供我们直接使用,在使用过程中的体会是简单到令人发指,一个简单的 ...
-
auto
2019-05-02 06:56:58
python
1954°
20
高阶函数:简单来讲,一个函数可以接收另一个函数来作为参数,这样的函数称之为高阶函数 map函数 会根据提供的函数对指定序列做映射,也就是说将函数作用在指定序列 语法为 map(function,interable...) filter函数 用来过滤序列的元素,该接收两个参数,第一个为函数,第二个为序 ...
-
auto
2019-05-02 06:56:58
python
1977°
20
前言 通常来说,在传统零售行业中80%的收益来自于20%的客户,因此对客户的价值进行分类显得尤其重要,而在本文我们基于批发经销商客户的真实消费数据,建立K-means聚类模型来对客户价值进行细分。 目录 1. 数据来源及背景 2. 明确分析目的 3. 数据探索分析 4. 数据预处理 5. 构建模型 ...
-
auto
2019-05-02 06:53:03
python
1831°
20
删除 # 删除 # 只能删除文件,若为目录则报错# 若文件正在使用,Windows下会直接报错,Linux下会在目录表中删除记录,但文件还在# 与os.unlink()一样的作用os.remove(r"C:\Users\Microsoft\Desktop\111.exe")# 删除目录,目录必须为空 ...
-
auto
2019-05-02 06:53:03
python
2103°
20
[TOC] 1. URL的组成 汉字通过URL encode(UTF 8)编码出来的编码,里面的字符全是打字节 如果你复制粘贴下来这个网址,出来的不是汉字,而是编码后的字节 https://www.baidu.com/s?wd=%E7%BC%96%E7%A8%8B%E5%90%A7 我们也可以在py ...
-
auto
2019-05-02 06:53:03
python
1791°
20
写在前面 很高兴我这系列的文章写道第18篇了,今天写一个爬虫爱好者特别喜欢的网站煎蛋网 ,这个网站其实还是有点意思的,网站很多人写了N多的教程了,各种方式的都有,当然网站本身在爬虫爱好者的不断进攻下,也在不断的完善,反爬措施也很多,今天我用 在揍他一波。 整体看上去,煎蛋网的妹子图质量还是可以的,不 ...
-
auto
2019-05-02 06:53:03
python
1903°
20
只对当前文件有效的操作:菜单栏->View -> Active Editor -> Use Soft Wraps; 如果想对所有文件都有效,就要在setting里面进行操作:File-> Setting-> Editor-> General -> Use soft wraps in editor。 ...
-
auto
2019-05-02 06:53:03
python
1855°
20
今天在写一个StringIO.write(int)示例时思维那么一发散就拐到了字符集的问题上,顺手搜索一发,除了极少数以外,绝大多数中文博客都解释的惨不忍睹,再鉴于被此问题在oracle的字符集体系中蹂躏过,因此在过往笔记的基础上增删了几个示例贴出来。 Python2: 首先清楚两个Python 2 ...
-
auto
2019-05-02 06:53:03
python
2332°
20
一般的的静态HTML页面可以使用requests等库直接抓取,但还有一部分比较复杂的动态页面,这些页面的DOM是动态生成的,有些还需要用户与其点击互动,这些页面只能使用真实的浏览器引擎动态解析,Selenium和Chrome Headless可以很好的达到这种目的。 Headless Chrome ...
-
auto
2019-05-02 06:53:03
python
2093°
20
《从零开始PYTHON3》学习资源包下载 课程连载已经完全结束。 经过整理校对,这里把在课程中出现过的源码和练习答案示例源码全部打包提供下载: 提取码:f3r6 压缩包解压密码:https://formoon.github.io 资源包中还包含了64位Windows版本的Python3安装包,是验证 ...
-
auto
2019-05-02 06:53:03
python
1971°
20
1.学习爬虫,为什么必须会正则表达式? 我们爬取一些网页具体内容时,只需要这个网页某个标签的一部分内容就足够,或者是这个标签的某个属性的值时,用普通的 xpath 或者css.selector是不能完成的,此时我们就需用到正则表达式去匹配获取。2.正则表达式官方简介? 正则表达式,又称规则表达式。( ...
-
auto
2019-05-02 06:53:03
python
2068°
20
网络编程协议 1.osi七层模型 应用层 表示层 会话层 传输层 网络层 数据链路层 物理层 2.套接字 socket 有两类,一种基于文件类型,一种基于网络类型 3.Tcp和udp协议 Tcp协议:面向连接,数据可靠,传输效率低,面向字节流 建立连接与断开连接的过程(三次握手,四次挥手) 建立连接 ...
-
auto
2019-05-02 06:53:03
python
2335°
20
计数器 Counter 计数元素迭代器 elements() 计数对象拷贝 copy() 计数对象清空 clear() 有序字典 OrderedDict (对字典的补充,可以记住字典元素添加的顺序) 默认字典 defaultdict,(指定字典值的类型) 可命名元组 namedtuple (给元组对 ...
-
auto
2019-05-02 06:53:03
python
2106°
20
Django 系列博客(二) 前言 今天博客的内容为使用 Django 完成第一个 Django 页面,并进行一些简单页面的搭建和转跳。 命令行搭建 Django 项目 创建纯净虚拟环境 在上一篇博客中已经安装好了虚拟环境,所以用虚拟环境来安装指定版本的 Django。为了可以从头到尾的走一遍流程, ...
-
auto
2019-05-02 06:53:03
python
1876°
20
Python是一门语法优雅,功能强大,开发效率高,应用领域广泛的解释性语言。 其有非常多的优点,但是也并不是完美的,除了大家都知道的执行速度不够快,Python2和Python3的兼容问题,以及GIL锁,在其语法上也有一些特点(是否是缺点见仁见智啦): 1. 使用可变对象作为函数默认值 代码如下: ...
-
auto
2019-05-02 06:53:03
python
2151°
20
输出为 ...
-
auto
2019-05-02 06:53:03
python
1605°
20
Python中进行并发编程一般使用threading和multiprocessing模块,不过大部分的并发编程任务都是派生一系列线程,从队列中收集资源,然后用队列收集结果。在这些任务中,往往需要生成线程池,concurrent.futures模块对threading和multiprocessing模 ...
-
auto
2019-05-02 06:53:03
python
2588°
20
一、执行 Python 脚本的两种方式 1.把python执行文件加到计算机的环境变量中,然后新建文件把程序写在新文件里,再通过cmd命令打开命令提示符终端,输入python + 文件名(路径也要写全)回车执行即可。 2.直接在命令行输入python进入python解释器,然后把程序输入进去,执行获 ...
-
auto
2019-05-02 06:53:03
python
2231°
20
1. 获取AJAX加载动态页面的内容 1.1. Introduction 如果所爬取的网址是通过Ajax方式加载的,就直接抓包,拿他后面传输数据的文件 有些网页内容使用AJAX加载,只要记得,AJAX一般返回的是JSON,直接对AJAX地址进行post或get,就返回JSON数据了。 拿到JSAON ...