python3.7简单的爬虫实例详解


Posted in Python onJuly 08, 2019

python3.7简单的爬虫,具体代码如下所示:

#https://www.runoob.com/w3cnote/python-spider-intro.html

#Python 爬虫介绍

import urllib.parse
import urllib.request
from http import cookiejar
url = "http://www.baidu.com"
response1 = urllib.request.urlopen(url)
print("第一种方法")
#获取状态码,200表示成功
print(response1.getcode())
#获取网页内容的长度
print(str(response1.read()))
print(len(response1.read()))
print("第二种方法")
request = urllib.request.Request(url)
#模拟Mozilla浏览器进行爬虫
request.add_header("user-agent","Mozilla/5.0")
response2 = urllib.request.urlopen(request)
print(response2.getcode())
print(len(response2.read()))
print("第三种方法")
cookie = cookiejar.CookieJar()
#加入urllib2处理cookie的能力#
opener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cookie))
urllib.request.install_opener(opener)
response3 = urllib.request.urlopen(url)
print(response3.getcode())
print(len(response3.read()))
print(cookie)
code: https://github.com/pascal19821003/python
path: python/study/tutorial/pachong/1.py

总结

以上所述是小编给大家介绍的python3.7简单的爬虫实例详解,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

Python 相关文章推荐
PHP webshell检查工具 python实现代码
Sep 15 Python
python自动化测试实例解析
Sep 28 Python
Python双精度浮点数运算并分行显示操作示例
Jul 21 Python
Python语言描述连续子数组的最大和
Jan 04 Python
python3+PyQt5图形项的自定义和交互 python3实现page Designer应用程序
Jul 20 Python
Python实现二维曲线拟合的方法
Dec 29 Python
python 绘制拟合曲线并加指定点标识的实现
Jul 10 Python
Python退出时强制运行一段代码的实现方法
Apr 29 Python
解决Django Haystack全文检索为空的问题
May 19 Python
使用Python中tkinter库简单gui界面制作及打包成exe的操作方法(二)
Oct 12 Python
Python学习工具jupyter notebook安装及用法解析
Oct 23 Python
Python常用base64 md5 aes des crc32加密解密方法汇总
Nov 06 Python
在python中画正态分布图像的实例
Jul 08 #Python
python实现beta分布概率密度函数的方法
Jul 08 #Python
python中pip的使用和修改下载源的方法
Jul 08 #Python
python绘制直方图和密度图的实例
Jul 08 #Python
搭建python django虚拟环境完整步骤详解
Jul 08 #Python
python中break、continue 、exit() 、pass终止循环的区别详解
Jul 08 #Python
33个Python爬虫项目实战(推荐)
Jul 08 #Python
You might like
PHP安全上传图片的方法
2015/03/21 PHP
基于JQuery的多标签实现代码
2012/09/19 Javascript
对new functionName()定义一个函数的理解
2014/05/22 Javascript
JavaScript中getUTCMinutes()方法的使用详解
2015/06/10 Javascript
jQuery如何解决IE输入框不能输入的问题
2016/10/08 Javascript
AngularJS中一般函数参数传递用法分析
2016/11/22 Javascript
Bootstrap基本组件学习笔记之列表组(11)
2016/12/07 Javascript
vue高德地图之玩转周边
2017/06/16 Javascript
微信小程序支付功能 php后台对接完整代码分享
2018/06/12 Javascript
解决vue-cli脚手架打包后vendor文件过大的问题
2018/09/27 Javascript
命令行批量截图Node脚本示例代码
2019/01/25 Javascript
深入了解JavaScript 私有化
2019/05/30 Javascript
[02:29]DOTA2英雄基础教程 陈
2013/12/17 DOTA
在Python中使用mechanize模块模拟浏览器功能
2015/05/05 Python
教你用python3根据关键词爬取百度百科的内容
2016/08/18 Python
Python文件操作,open读写文件,追加文本内容实例
2016/12/14 Python
Django中间件实现拦截器的方法
2018/06/01 Python
用Python去除图像的黑色或白色背景实例
2019/12/12 Python
python 元组和列表的区别
2020/12/30 Python
用python对excel查重
2020/12/07 Python
Python 中的函数装饰器和闭包详解
2021/02/06 Python
使用CSS3配合IE滤镜实现渐变和投影的效果
2015/09/06 HTML / CSS
Osklen官方在线商店:巴西服装品牌
2019/04/25 全球购物
Magee 1866官网:Donegal粗花呢外套和大衣专家
2019/11/01 全球购物
有机婴儿毛毯和衣服:Monica + Andy
2020/03/01 全球购物
C语言编程题
2015/03/09 面试题
Java面试题:Java类的Main方法如果是Private将会怎么样
2016/08/18 面试题
总裁办公室主任职责
2014/01/02 职场文书
教师自我剖析材料(群众路线)
2014/09/29 职场文书
2014年党员教师自我剖析材料
2014/09/30 职场文书
怎样写辞职信
2015/02/27 职场文书
放飞理想主题班会
2015/08/14 职场文书
导游词书写之黄山
2019/08/06 职场文书
详解Python函数print用法
2021/06/18 Python
Python获取指定日期是"星期几"的6种方法
2022/03/13 Python
Innodb存储引擎中的后台线程详解
2022/04/03 MySQL