python3中编码获取网页的实例方法


Posted in Python onNovember 16, 2020

学了python后,之前一些我们常用的方法,也可以换一种思路用python中的知识来解决。相信操作出来后,能收获一大批小粉丝们。就像我们没学习编程之前,看到那种大神都是可望而不可即。今天我们就之前简单获取网页的这种操作用python中的编码来解决,大家可以自行体会一下两者的不同。

1. encoding和apparent_encoding

import scrapy
url="https://www.xxx.net/html/gndy/dyzz/index.html"
re=requests.get(url)
#获取响应头Content-Type的charset值,有的网站没有charset字段,就可能使用默认的 ISO-8859-1
print(re.encoding)
#apparent_encoding就是获取网站真实的编码
print(re.apparent_encoding)

2. 处理方案

直接用r.encoding = ‘xxx'

re.encoding='utf-8'

3. requests的text() 跟 content() 有什么区别

re.text返回的是处理过的Unicode型的数据,

而使用re.content返回的是bytes型的原始数据。

4. 爬虫拿到的HTML和浏览器中的源码不相同时

通过下载源码对比

import requests
url = 'https://www.xxx.net/html/gndy/dyzz/index.html'
r = requests.get(url)
r.encoding = r.apparent_encoding
html = r.text
with open('test.html','w',encoding='utf8') as f:
f.write(html)

 python3中编码获取网页的实例方法

到此这篇关于python3中编码获取网页的实例方法的文章就介绍到这了,更多相关python3中编码如何获取网页内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python BeautifulSoup使用方法详解
Nov 21 Python
在 Django/Flask 开发服务器上使用 HTTPS
Jul 03 Python
Python中方法链的使用方法
Feb 23 Python
Python有序字典简单实现方法示例
Sep 28 Python
python增加图像对比度的方法
Jul 12 Python
Python 用三行代码提取PDF表格数据
Oct 13 Python
django中media媒体路径设置的步骤
Nov 15 Python
Python标准库itertools的使用方法
Jan 17 Python
Django serializer优化类视图的实现示例
Jul 16 Python
python爬虫数据保存到mongoDB的实例方法
Jul 28 Python
10个顶级Python实用库推荐
Mar 04 Python
Python字符串格式化方式
Apr 07 Python
Python3中小括号()、中括号[]、花括号{}的区别详解
Nov 15 #Python
Python根据URL地址下载文件并保存至对应目录的实现
Nov 15 #Python
python re的findall和finditer的区别详解
Nov 15 #Python
Python获取android设备cpu和内存占用情况
Nov 15 #Python
Python __slots__的使用方法
Nov 15 #Python
Python descriptor(描述符)的实现
Nov 15 #Python
基于OpenCV的网络实时视频流传输的实现
Nov 15 #Python
You might like
修改PHP的memory_limit限制的方法分享
2012/02/21 PHP
神盾加密解密教程(一)PHP变量可用字符
2014/05/28 PHP
使用phpstorm和xdebug实现远程调试的方法
2015/12/29 PHP
php die()与exit()的区别实例详解
2016/12/03 PHP
PHP对象相关知识总结
2017/04/09 PHP
PHP hebrev()函数用法讲解
2019/02/21 PHP
微信支付之JSAPI公众号支付详解
2019/05/15 PHP
JQuery 学习笔记 选择器之三
2009/07/23 Javascript
从父页面读取和操作iframe中内容方法
2009/07/25 Javascript
jQuery函数map()和each()介绍及异同点分析
2014/11/08 Javascript
jQuery前端框架easyui使用Dialog时bug处理
2014/12/05 Javascript
JavaScript实现函数返回多个值的方法
2015/06/09 Javascript
JQuery包裹DOM节点的方法
2015/06/11 Javascript
基于BootStrap Metronic开发框架经验小结【五】Bootstrap File Input文件上传插件的用法详解
2016/05/12 Javascript
AngularJs Scope详解及示例代码
2016/09/01 Javascript
JavaScript学习笔记整理_关于表达式和语句
2016/09/19 Javascript
判断颜色是否合法的正则表达式(详解)
2017/05/03 Javascript
JS实现换肤功能的方法实例详解
2019/01/30 Javascript
微信JSSDK实现打开摄像头拍照再将相片保存到服务器
2019/11/15 Javascript
Vue+penlayers实现多边形绘制及展示
2020/12/24 Vue.js
JavaScript中layim之整合右键菜单的示例代码
2021/02/06 Javascript
[13:40]TI3青蛙君全程回顾 DOTA2我们为梦想再战
2013/09/13 DOTA
[46:03]LGD vs VGJ.T 2018国际邀请赛小组赛BO2 第一场 8.16
2018/08/17 DOTA
使用django-crontab实现定时任务的示例
2018/02/26 Python
Python实现的读写json文件功能示例
2018/06/05 Python
python Django中models进行模糊查询的示例
2019/07/18 Python
面向对象设计的原则是什么
2013/02/13 面试题
销售行业个人求职自荐信
2013/09/25 职场文书
司机检讨书
2014/02/13 职场文书
大学新生军训感言
2014/02/25 职场文书
培训主管的职业生涯规划
2014/03/06 职场文书
房屋授权委托书范本
2014/10/07 职场文书
鲁迅故里导游词
2015/02/05 职场文书
大学毕业典礼致辞
2015/07/29 职场文书
餐馆开业致辞
2015/08/01 职场文书
Rust中的Struct使用示例详解
2022/08/14 Javascript