python3.7简单的爬虫实例详解


Posted in Python onJuly 08, 2019

python3.7简单的爬虫,具体代码如下所示:

#https://www.runoob.com/w3cnote/python-spider-intro.html

#Python 爬虫介绍

import urllib.parse
import urllib.request
from http import cookiejar
url = "http://www.baidu.com"
response1 = urllib.request.urlopen(url)
print("第一种方法")
#获取状态码,200表示成功
print(response1.getcode())
#获取网页内容的长度
print(str(response1.read()))
print(len(response1.read()))
print("第二种方法")
request = urllib.request.Request(url)
#模拟Mozilla浏览器进行爬虫
request.add_header("user-agent","Mozilla/5.0")
response2 = urllib.request.urlopen(request)
print(response2.getcode())
print(len(response2.read()))
print("第三种方法")
cookie = cookiejar.CookieJar()
#加入urllib2处理cookie的能力#
opener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cookie))
urllib.request.install_opener(opener)
response3 = urllib.request.urlopen(url)
print(response3.getcode())
print(len(response3.read()))
print(cookie)
code: https://github.com/pascal19821003/python
path: python/study/tutorial/pachong/1.py

总结

以上所述是小编给大家介绍的python3.7简单的爬虫实例详解,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

Python 相关文章推荐
Python中的两个内置模块介绍
Apr 05 Python
Python实现的远程登录windows系统功能示例
Jun 21 Python
Python走楼梯问题解决方法示例
Jul 25 Python
pyinstaller打包多个py文件和去除cmd黑框的方法
Jun 21 Python
python3中eval函数用法使用简介
Aug 02 Python
python字典的setdefault的巧妙用法
Aug 07 Python
Python通过cv2读取多个USB摄像头
Aug 28 Python
Python 3 使用Pillow生成漂亮的分形树图片
Dec 24 Python
Tensorflow全局设置可见GPU编号操作
Jun 30 Python
Python selenium爬取微信公众号文章代码详解
Aug 12 Python
基于python实现简单网页服务器代码实例
Sep 14 Python
python绘制分布折线图的示例
Sep 24 Python
在python中画正态分布图像的实例
Jul 08 #Python
python实现beta分布概率密度函数的方法
Jul 08 #Python
python中pip的使用和修改下载源的方法
Jul 08 #Python
python绘制直方图和密度图的实例
Jul 08 #Python
搭建python django虚拟环境完整步骤详解
Jul 08 #Python
python中break、continue 、exit() 、pass终止循环的区别详解
Jul 08 #Python
33个Python爬虫项目实战(推荐)
Jul 08 #Python
You might like
php单例模式的简单实现方法
2016/06/10 PHP
php获取客户端IP及URL的方法示例
2017/02/03 PHP
PHP使用CURL实现下载文件功能示例
2019/06/03 PHP
解决php写入数据库乱码的问题
2019/09/17 PHP
jquery中通过父级查找进行定位示例
2013/06/28 Javascript
引用外部脚本时script标签关闭的写法
2014/01/20 Javascript
node.js中的buffer.length方法使用说明
2014/12/14 Javascript
jQuery插件slick实现响应式移动端幻灯片图片切换特效
2015/04/12 Javascript
Vue学习之路之登录注册实例代码
2017/07/06 Javascript
JS获取数组中出现次数最多及第二多元素的方法
2017/10/27 Javascript
深入理解Angular4订阅(Subscribe)与取消
2017/11/22 Javascript
最新Javascript程序员面试试题和解题方法
2017/11/23 Javascript
jQuery中each和js中forEach的区别分析
2019/02/27 jQuery
vue 列表页跳转详情页获取id以及详情页通过id获取数据
2019/03/27 Javascript
vue实现学生信息管理系统
2020/05/30 Javascript
jQuery实现鼠标拖拽登录框移动效果
2020/09/13 jQuery
[20:21]《一刀刀一天》第十六期:TI国际邀请赛正式打响,总奖金超过550万
2014/05/23 DOTA
[01:28:31]《加油DOTA》真人秀 第五期
2014/09/01 DOTA
深入解析Python中的lambda表达式的用法
2015/08/28 Python
利用Python生成文件md5校验值函数的方法
2017/01/10 Python
python+jinja2实现接口数据批量生成工具
2019/08/28 Python
python 单线程和异步协程工作方式解析
2019/09/28 Python
通过实例解析Python调用json模块
2019/12/11 Python
python 实现字符串下标的输出功能
2020/02/13 Python
浅谈python累加求和+奇偶数求和_break_continue
2020/02/25 Python
基于打开pycharm有带图片md文件卡死问题的解决
2020/04/24 Python
python制作一个简单的gui 数据库查询界面
2020/11/19 Python
基于HTML5新特性Mutation Observer实现编辑器的撤销和回退操作
2016/01/11 HTML / CSS
德国游戏机商店:Konsolenkost
2019/12/08 全球购物
营销与策划个人求职信
2013/09/22 职场文书
2014乡镇“三八”国际劳动妇女节活动总结
2014/03/01 职场文书
倡议书范文格式
2014/05/12 职场文书
领导四风问题整改措施思想汇报
2014/10/13 职场文书
教师批评与自我批评(群众路线)
2014/10/15 职场文书
Nginx搭建rtmp直播服务器实现代码
2021/03/31 Servers
美国运营商 T-Mobile 以 117.83Mb/s 的速度排第一位
2022/04/21 数码科技