Python3使用requests包抓取并保存网页源码的方法


Posted in Python onMarch 15, 2016

本文实例讲述了Python3使用requests包抓取并保存网页源码的方法。分享给大家供大家参考,具体如下:

使用Python 3的requests模块抓取网页源码并保存到文件示例:

import requests
html = requests.get("http://www.baidu.com")
with open('test.txt','w',encoding='utf-8') as f:
 f.write(html.text)

这是一个基本的文件保存操作,但这里有几个值得注意的问题:

1.安装requests包,命令行输入pip install requests即可自动安装。很多人推荐使用requests,自带的urllib.request也可以抓取网页源码

2.open方法encoding参数设为utf-8,否则保存的文件会出现乱码。

3.如果直接在cmd中输出抓取的内容,会提示各种编码错误,所以保存到文件查看。

4.with open方法是更好的写法,可以自动操作完毕后释放资源。

另一个例子:

import requests
ff = open('testt.txt','w',encoding='utf-8')
with open('test.txt',encoding="utf-8") as f:
 for line in f:
 ff.write(line)
ff.close()

这是演示读取一个txt文件,每次读取一行,并保存到另一个txt文件中的示例。

因为在命令行中打印每次读取一行的数据,中文会出现编码错误,所以每次读取一行并保存到另一个文件,这样来测试读取是否正常。(注意open的时候制定encoding编码方式)

转自:小谈博客 http://www.tantengvip.com/2015/05/requests-html/

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
python利用urllib实现爬取京东网站商品图片的爬虫实例
Aug 24 Python
Python数据分析之双色球统计两个红和蓝球哪组合比例高的方法
Feb 03 Python
使用python获取csv文本的某行或某列数据的实例
Apr 03 Python
对PyTorch torch.stack的实例讲解
Jul 30 Python
python面试题小结附答案实例代码
Apr 11 Python
详解将Pandas中的DataFrame类型转换成Numpy中array类型的三种方法
Jul 06 Python
django 实现celery动态设置周期任务执行时间
Nov 19 Python
python实现从ftp服务器下载文件
Mar 03 Python
Python操作PostgreSql数据库的方法(基本的增删改查)
Dec 29 Python
python实现图片九宫格分割的示例
Apr 25 Python
基于tensorflow权重文件的解读
May 26 Python
python使用PySimpleGUI设置进度条及控件使用
Jun 10 Python
Python减少循环层次和缩进的技巧分析
Mar 15 #Python
Python作用域用法实例详解
Mar 15 #Python
Python的净值数据接口调用示例分享
Mar 15 #Python
Python简单连接MongoDB数据库的方法
Mar 15 #Python
Python函数中的函数(闭包)用法实例
Mar 15 #Python
实例讲解Python中函数的调用与定义
Mar 14 #Python
Python使用multiprocessing实现一个最简单的分布式作业调度系统
Mar 14 #Python
You might like
PHP中创建并处理图象
2006/10/09 PHP
PHP数据流应用的一个简单实例
2012/09/14 PHP
php查看请求头信息获取远程图片大小的方法分享
2013/12/25 PHP
php实现读取内存顺序号
2015/03/29 PHP
ThinkPHP自定义函数解决模板标签加减运算的方法
2015/07/03 PHP
TP5框架安全机制实例分析
2020/04/05 PHP
jQuery UI Dialog控件中的表单无法正常提交的解决方法
2010/12/19 Javascript
Javascript 实现图片无缝滚动
2014/12/19 Javascript
基于jQuery1.9版本如何判断浏览器版本类型
2016/01/12 Javascript
JavaScript 2048 游戏实例代码(简单易懂)
2016/03/25 Javascript
AngularJS下对数组的对比分析
2016/08/24 Javascript
JS实用的带停顿的逐行文本循环滚动效果实例
2016/11/23 Javascript
给vue项目添加ESLint的详细步骤
2017/09/29 Javascript
vue实现todolist基本功能以及数据存储功能实例详解
2019/04/11 Javascript
JS+HTML实现自定义上传图片按钮并显示图片功能的方法分析
2020/02/12 Javascript
Element InputNumber 计数器的实现示例
2020/08/03 Javascript
解决Vue keep-alive 调用 $destory() 页面不再被缓存的情况
2020/10/30 Javascript
[03:04]DOTA2超级联赛专访ZSMJ “莫名其妙”的逆袭
2013/05/23 DOTA
Python OpenCV读取png图像转成jpg图像存储的方法
2018/10/28 Python
Python 将Matrix、Dict保存到文件的方法
2018/10/30 Python
python实现点击按钮修改数据的方法
2019/07/17 Python
Flask框架模板渲染操作简单示例
2019/07/31 Python
基于python分析你的上网行为 看看你平时上网都在干嘛
2019/08/13 Python
Django 批量插入数据的实现方法
2020/01/12 Python
Python-openCV读RGB通道图实例
2020/01/17 Python
Python的pygame安装教程详解
2020/02/10 Python
python+opencv实现车道线检测
2021/02/19 Python
简单聊聊H5的pushState与replaceState的用法
2018/04/03 HTML / CSS
类、抽象类、接口的差异
2016/06/13 面试题
会计人员岗位职责
2014/03/19 职场文书
2014党的群众路线教育实践活动学习心得体会
2014/10/31 职场文书
违纪检讨书
2015/01/27 职场文书
个人工作保证书
2015/02/28 职场文书
庆七一晚会主持词
2015/06/30 职场文书
教你使用vscode 搭建react-native开发环境
2021/07/07 Javascript
Go语言编译原理之源码调试
2022/08/05 Golang