python爬虫
请求库(requests)
安装
1 | pip install requests |
用法
带参数get请求
1 | import requests |
1 | import requests |
获取二进制数据(用于保存图片视频)
1 | import requests |
添加headers
1 | import requests |
基本post请求
1 | import requests |
文件上传
1 | import requests |
会话维持
1 | import requests |
证书验证
1 | import requests |
解析库(BeautifulSoup)
安装
1 | pip3 install bs4 |
1 | pip install lxml |
标准选择器
1 | from bs4 import BeautifulSoup |
css选择器
获取内容及属性值
1 | from bs4 import BeautifulSoup |
通过类名查找
1 | s=soup.select('.question_link') |
转载请注明来源,欢迎对文章中的引用来源进行考证,欢迎指出任何有错误或不够清晰的表达。可以在下面评论区评论,也可以邮件至 jaytp@qq.com
文章标题:python爬虫
本文作者:子非鱼
发布时间:2018-11-04, 11:19:29
最后更新:2018-10-07, 09:07:30
原始链接:https://Wangsr.cn/2018/11/04/2018-2018-01-30-python爬虫/版权声明: "署名-非商用-相同方式共享 4.0" 转载请保留原文链接及作者。