python3.7简单的爬虫实例详解


Posted in Python onJuly 08, 2019

python3.7简单的爬虫,具体代码如下所示:

#https://www.runoob.com/w3cnote/python-spider-intro.html

#Python 爬虫介绍

import urllib.parse
import urllib.request
from http import cookiejar
url = "http://www.baidu.com"
response1 = urllib.request.urlopen(url)
print("第一种方法")
#获取状态码,200表示成功
print(response1.getcode())
#获取网页内容的长度
print(str(response1.read()))
print(len(response1.read()))
print("第二种方法")
request = urllib.request.Request(url)
#模拟Mozilla浏览器进行爬虫
request.add_header("user-agent","Mozilla/5.0")
response2 = urllib.request.urlopen(request)
print(response2.getcode())
print(len(response2.read()))
print("第三种方法")
cookie = cookiejar.CookieJar()
#加入urllib2处理cookie的能力#
opener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cookie))
urllib.request.install_opener(opener)
response3 = urllib.request.urlopen(url)
print(response3.getcode())
print(len(response3.read()))
print(cookie)
code: https://github.com/pascal19821003/python
path: python/study/tutorial/pachong/1.py

总结

以上所述是小编给大家介绍的python3.7简单的爬虫实例详解,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

Python 相关文章推荐
用python分割TXT文件成4K的TXT文件
May 23 Python
python 网络爬虫初级实现代码
Feb 27 Python
Python中使用platform模块获取系统信息的用法教程
Jul 08 Python
django 微信网页授权登陆的实现
Jul 30 Python
给大家整理了19个pythonic的编程习惯(小结)
Sep 25 Python
python反转列表的三种方式解析
Nov 08 Python
Python实现银行账户资金交易管理系统
Jan 03 Python
python高阶函数map()和reduce()实例解析
Mar 16 Python
哈工大自然语言处理工具箱之ltp在windows10下的安装使用教程
May 07 Python
python调用API接口实现登陆短信验证
May 10 Python
基于Python的接口自动化读写excel文件的方法
Jan 15 Python
使用pycharm运行flask应用程序的详细教程
Jun 07 Python
在python中画正态分布图像的实例
Jul 08 #Python
python实现beta分布概率密度函数的方法
Jul 08 #Python
python中pip的使用和修改下载源的方法
Jul 08 #Python
python绘制直方图和密度图的实例
Jul 08 #Python
搭建python django虚拟环境完整步骤详解
Jul 08 #Python
python中break、continue 、exit() 、pass终止循环的区别详解
Jul 08 #Python
33个Python爬虫项目实战(推荐)
Jul 08 #Python
You might like
用Flash图形化数据(二)
2006/10/09 PHP
php&mysql 日期操作小记
2012/02/27 PHP
微信自定义菜单的创建/查询/取消php示例代码
2016/08/05 PHP
自制PHP框架之路由与控制器
2017/05/07 PHP
js获取图片长和宽度的代码
2009/11/24 Javascript
treepanel动态加载数据实现代码
2012/12/15 Javascript
JavaScript执行效率与性能提升方案
2012/12/21 Javascript
JS检测输入字符是否包含非法字符的示例代码
2014/02/11 Javascript
jquery重复提交请求的原因浅析
2014/05/23 Javascript
基于JS实现的倒计时程序实例
2015/07/24 Javascript
学习JavaScript设计模式之单例模式
2016/01/19 Javascript
Javascript中的Prototype到底是什么
2016/02/16 Javascript
JavaScript字符串对象(string)基本用法示例
2017/01/18 Javascript
在vue中获取微信支付code及code被占用问题的解决方法
2019/04/16 Javascript
AngularJS动态生成select下拉框的方法实例
2019/11/17 Javascript
原生JS实现弹幕效果的简单操作指南
2020/11/10 Javascript
Python随手笔记之标准类型内建函数
2015/12/02 Python
用Python将IP地址在整型和字符串之间轻松转换
2017/03/22 Python
python 3.6 +pyMysql 操作mysql数据库(实例讲解)
2017/12/20 Python
快速了解python leveldb
2018/01/18 Python
python tensorflow学习之识别单张图片的实现的示例
2018/02/09 Python
python matlibplot绘制3D图形
2018/07/02 Python
python程序 线程队列queue使用方法解析
2019/09/23 Python
python科学计算之narray对象用法
2019/11/25 Python
python中Django文件上传方法详解
2020/08/05 Python
全球酒店预订网站:Hotels.com
2016/08/10 全球购物
蒂芙尼澳大利亚官方网站:Tiffany&Co. Australia
2017/08/27 全球购物
How TDD works
2012/09/30 面试题
优秀技术工人先进材料
2014/02/17 职场文书
公司经理任命书
2014/06/05 职场文书
党员教师四风自我剖析材料
2014/09/30 职场文书
优秀团员自我评价
2015/03/10 职场文书
留学推荐信中文范文
2015/03/26 职场文书
朋友圈早安励志语录!
2019/07/08 职场文书
成功的商业计划书这样写才最靠谱
2019/07/12 职场文书
安装Ruby和 Rails的详细步骤
2022/04/19 Ruby