python3.7简单的爬虫实例详解


Posted in Python onJuly 08, 2019

python3.7简单的爬虫,具体代码如下所示:

#https://www.runoob.com/w3cnote/python-spider-intro.html

#Python 爬虫介绍

import urllib.parse
import urllib.request
from http import cookiejar
url = "http://www.baidu.com"
response1 = urllib.request.urlopen(url)
print("第一种方法")
#获取状态码,200表示成功
print(response1.getcode())
#获取网页内容的长度
print(str(response1.read()))
print(len(response1.read()))
print("第二种方法")
request = urllib.request.Request(url)
#模拟Mozilla浏览器进行爬虫
request.add_header("user-agent","Mozilla/5.0")
response2 = urllib.request.urlopen(request)
print(response2.getcode())
print(len(response2.read()))
print("第三种方法")
cookie = cookiejar.CookieJar()
#加入urllib2处理cookie的能力#
opener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cookie))
urllib.request.install_opener(opener)
response3 = urllib.request.urlopen(url)
print(response3.getcode())
print(len(response3.read()))
print(cookie)
code: https://github.com/pascal19821003/python
path: python/study/tutorial/pachong/1.py

总结

以上所述是小编给大家介绍的python3.7简单的爬虫实例详解,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

Python 相关文章推荐
用Python进行行为驱动开发的入门教程
Apr 23 Python
Sublime开发python程序的示例代码
Jan 24 Python
pandas.DataFrame 根据条件新建列并赋值的方法
Apr 08 Python
Python实现调用另一个路径下py文件中的函数方法总结
Jun 07 Python
python获取代码运行时间的实例代码
Jun 11 Python
Python一句代码实现找出所有水仙花数的方法
Nov 13 Python
一步步教你用python的scrapy编写一个爬虫
Apr 17 Python
python数值基础知识浅析
Nov 19 Python
python 普通克里金(Kriging)法的实现
Dec 19 Python
Django表单提交后实现获取相同name的不同value值
May 14 Python
浅谈Python 参数与变量
Jun 20 Python
Python 使用xlwt模块将多行多列数据循环写入excel文档的操作
Nov 10 Python
在python中画正态分布图像的实例
Jul 08 #Python
python实现beta分布概率密度函数的方法
Jul 08 #Python
python中pip的使用和修改下载源的方法
Jul 08 #Python
python绘制直方图和密度图的实例
Jul 08 #Python
搭建python django虚拟环境完整步骤详解
Jul 08 #Python
python中break、continue 、exit() 、pass终止循环的区别详解
Jul 08 #Python
33个Python爬虫项目实战(推荐)
Jul 08 #Python
You might like
几个有用的php字符串过滤,转换函数代码
2012/05/01 PHP
php日历制作代码分享
2014/01/20 PHP
XML+XSL 与 HTML 两种方案的结合
2007/04/22 Javascript
javascript 用原型继承来实现对象系统
2010/03/22 Javascript
利用google提供的API(JavaScript接口)获取网站访问者IP地理位置的代码详解
2010/07/24 Javascript
jQuery之折叠面板的深入解析
2013/06/19 Javascript
javascript break指定标签打破多层循环示例
2014/01/20 Javascript
JS将所有对象s的属性复制给对象r(原生js+jquery)
2014/01/25 Javascript
将form表单中的元素转换成对象的方法适用表单提交
2014/05/02 Javascript
JavaScript获取表单内所有元素值的方法
2015/04/02 Javascript
angular2使用简单介绍
2016/03/01 Javascript
jquery.form.js框架实现文件上传功能案例解析(springmvc)
2016/05/26 Javascript
AngularJS constant和value区别详解
2017/02/28 Javascript
JS实现针对给定时间的倒计时功能示例
2017/04/11 Javascript
Vue如何实现组件的源码解析
2017/06/08 Javascript
vue.js+Echarts开发图表放大缩小功能实例
2017/06/09 Javascript
[js高手之路]图解javascript的原型(prototype)对象,原型链实例
2017/08/28 Javascript
angularjs 页面自适应高度的方法
2018/01/17 Javascript
使用JSON格式提交数据到服务端的实例代码
2018/04/01 Javascript
Vue实现省市区三级联动
2020/12/27 Vue.js
Python中的Numpy入门教程
2014/04/26 Python
Python二维码生成库qrcode安装和使用示例
2014/12/16 Python
python2.6.6如何升级到python2.7.14
2018/04/08 Python
如何优雅地改进Django中的模板碎片缓存详解
2018/07/04 Python
详解配置Django的Celery异步之路踩坑
2018/11/25 Python
记录Python脚本的运行日志的方法
2019/06/05 Python
python 利用turtle模块画出没有角的方格
2019/11/23 Python
Python 线性回归分析以及评价指标详解
2020/04/02 Python
Python Tkinter实例——模拟掷骰子
2020/10/24 Python
python 爬取百度文库并下载(免费文章限定)
2020/12/04 Python
客户服务经理岗位职责
2014/01/29 职场文书
运动会领导邀请函
2014/02/05 职场文书
2014年社区庆元旦活动方案
2014/03/08 职场文书
手机银行营销方案
2014/03/14 职场文书
学位证书委托书
2014/09/30 职场文书
教师作风整改措施思想汇报
2014/10/12 职场文书