python3.7简单的爬虫实例详解


Posted in Python onJuly 08, 2019

python3.7简单的爬虫,具体代码如下所示:

#https://www.runoob.com/w3cnote/python-spider-intro.html

#Python 爬虫介绍

import urllib.parse
import urllib.request
from http import cookiejar
url = "http://www.baidu.com"
response1 = urllib.request.urlopen(url)
print("第一种方法")
#获取状态码,200表示成功
print(response1.getcode())
#获取网页内容的长度
print(str(response1.read()))
print(len(response1.read()))
print("第二种方法")
request = urllib.request.Request(url)
#模拟Mozilla浏览器进行爬虫
request.add_header("user-agent","Mozilla/5.0")
response2 = urllib.request.urlopen(request)
print(response2.getcode())
print(len(response2.read()))
print("第三种方法")
cookie = cookiejar.CookieJar()
#加入urllib2处理cookie的能力#
opener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cookie))
urllib.request.install_opener(opener)
response3 = urllib.request.urlopen(url)
print(response3.getcode())
print(len(response3.read()))
print(cookie)
code: https://github.com/pascal19821003/python
path: python/study/tutorial/pachong/1.py

总结

以上所述是小编给大家介绍的python3.7简单的爬虫实例详解,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

Python 相关文章推荐
在Python的Django框架中显示对象子集的方法
Jul 21 Python
Python字符串、元组、列表、字典互相转换的方法
Jan 23 Python
Python如何获取系统iops示例代码
Sep 06 Python
Python安装模块的常见问题及解决方法
Feb 05 Python
pycharm 将python文件打包为exe格式的方法
Jan 16 Python
OpenCV+Python识别车牌和字符分割的实现
Jan 31 Python
python 图片二值化处理(处理后为纯黑白的图片)
Nov 01 Python
Python龙贝格法求积分实例
Feb 29 Python
matlab中二维插值函数interp2的使用详解
Apr 22 Python
python如何调用字典的key
May 25 Python
Python文件操作模拟用户登陆代码实例
Jun 09 Python
PyQt5的QWebEngineView使用示例
Oct 20 Python
在python中画正态分布图像的实例
Jul 08 #Python
python实现beta分布概率密度函数的方法
Jul 08 #Python
python中pip的使用和修改下载源的方法
Jul 08 #Python
python绘制直方图和密度图的实例
Jul 08 #Python
搭建python django虚拟环境完整步骤详解
Jul 08 #Python
python中break、continue 、exit() 、pass终止循环的区别详解
Jul 08 #Python
33个Python爬虫项目实战(推荐)
Jul 08 #Python
You might like
php下使用以下代码连接并测试
2008/04/09 PHP
PHP中查询SQL Server或Sybase时TEXT字段被截断的解决方法
2009/03/10 PHP
php自动获取字符串编码函数mb_detect_encoding
2011/05/31 PHP
PHP实现递归目录的5种方法
2016/10/27 PHP
php微信公众号开发之现金红包
2018/04/16 PHP
时间戳转换为时间 年月日时间的JS函数
2013/08/19 Javascript
jquery实现浮动的侧栏实例
2015/06/25 Javascript
jquery实现叠层3D文字特效代码分享
2015/08/21 Javascript
如何根据百度地图计算出两地之间的驾驶距离(两种语言js和C#)
2015/10/29 Javascript
jquery插件之文字间歇自动向上滚动效果代码
2016/02/25 Javascript
使用 stylelint检查CSS_StyleLint
2016/04/28 Javascript
JS基于面向对象实现的拖拽功能示例
2016/12/20 Javascript
整理关于Bootstrap列表组的慕课笔记
2017/03/29 Javascript
Bootstrap 实现表格样式、表单布局的实例代码
2018/12/09 Javascript
JavaScript中构造函数与原型链之间的关系详解
2019/02/25 Javascript
JavaScript实现英语单词题库
2019/12/24 Javascript
[06:45]DOTA2卡尔工作室 英雄介绍幻影长矛手篇
2013/07/12 DOTA
Python reduce()函数的用法小结
2017/11/15 Python
python实现将汉字保存成文本的方法
2018/11/16 Python
为什么Python中没有"a++"这种写法
2018/11/27 Python
python3+pyqt5+itchat微信定时发送消息的方法
2019/02/20 Python
使用Python制作简单的小程序IP查看器功能
2019/04/16 Python
使用pycharm在本地开发并实时同步到服务器
2019/08/02 Python
python将字典列表导出为Excel文件的方法
2019/09/02 Python
django中related_name的用法说明
2020/05/20 Python
PyTorch的torch.cat用法
2020/06/28 Python
html5实现多图片预览上传及点击可拖拽控件
2018/03/15 HTML / CSS
HTML5 Blob对象的具体使用
2020/05/22 HTML / CSS
美国著名的品牌折扣店:Burlington
2017/06/08 全球购物
Java中的类包括什么内容?设计时要注意哪些方面
2012/05/23 面试题
初中学生操行评语
2014/12/26 职场文书
社区三八妇女节活动总结
2015/02/06 职场文书
道歉信怎么写
2015/05/12 职场文书
2016七一建党节慰问信
2015/11/30 职场文书
mysql 索引的数据结构为什么要采用B+树
2022/04/26 MySQL
解决 redis 无法远程连接
2022/05/15 Redis