python3中编码获取网页的实例方法


Posted in Python onNovember 16, 2020

学了python后,之前一些我们常用的方法,也可以换一种思路用python中的知识来解决。相信操作出来后,能收获一大批小粉丝们。就像我们没学习编程之前,看到那种大神都是可望而不可即。今天我们就之前简单获取网页的这种操作用python中的编码来解决,大家可以自行体会一下两者的不同。

1. encoding和apparent_encoding

import scrapy
url="https://www.xxx.net/html/gndy/dyzz/index.html"
re=requests.get(url)
#获取响应头Content-Type的charset值,有的网站没有charset字段,就可能使用默认的 ISO-8859-1
print(re.encoding)
#apparent_encoding就是获取网站真实的编码
print(re.apparent_encoding)

2. 处理方案

直接用r.encoding = ‘xxx'

re.encoding='utf-8'

3. requests的text() 跟 content() 有什么区别

re.text返回的是处理过的Unicode型的数据,

而使用re.content返回的是bytes型的原始数据。

4. 爬虫拿到的HTML和浏览器中的源码不相同时

通过下载源码对比

import requests
url = 'https://www.xxx.net/html/gndy/dyzz/index.html'
r = requests.get(url)
r.encoding = r.apparent_encoding
html = r.text
with open('test.html','w',encoding='utf8') as f:
f.write(html)

 python3中编码获取网页的实例方法

到此这篇关于python3中编码获取网页的实例方法的文章就介绍到这了,更多相关python3中编码如何获取网页内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python操作摄像头截图实现远程监控的例子
Mar 25 Python
用python记录运行pid,并在需要时kill掉它们的实例
Jan 16 Python
python中如何使用正则表达式的集合字符示例
Oct 09 Python
用Python将一个列表分割成小列表的实例讲解
Jul 02 Python
解决python3捕获cx_oracle抛出的异常错误问题
Oct 18 Python
10 行Python 代码实现 AI 目标检测技术【推荐】
Jun 14 Python
python模块常用用法实例详解
Oct 17 Python
python 协程中的迭代器,生成器原理及应用实例详解
Oct 28 Python
开启Django博客的RSS功能的实现方法
Feb 17 Python
Django REST framwork的权限验证实例
Apr 02 Python
在Windows上安装和配置 Jupyter Lab 作为桌面级应用程序教程
Apr 22 Python
pycharm 关闭search everywhere的解决操作
Jan 15 Python
Python3中小括号()、中括号[]、花括号{}的区别详解
Nov 15 #Python
Python根据URL地址下载文件并保存至对应目录的实现
Nov 15 #Python
python re的findall和finditer的区别详解
Nov 15 #Python
Python获取android设备cpu和内存占用情况
Nov 15 #Python
Python __slots__的使用方法
Nov 15 #Python
Python descriptor(描述符)的实现
Nov 15 #Python
基于OpenCV的网络实时视频流传输的实现
Nov 15 #Python
You might like
PHP代码优化技巧小结
2015/09/29 PHP
php 处理png图片白色背景色改为透明色的实例代码
2018/12/10 PHP
详解PHP素材图片上传、下载功能
2019/04/12 PHP
在网页中屏蔽快捷键
2006/09/06 Javascript
驱动事件的addEvent.js代码
2007/03/27 Javascript
Code: write(s,d) 输出连续字符串
2007/08/19 Javascript
JavaScript 继承详解(三)
2009/07/13 Javascript
JS获取父节点方法
2009/08/20 Javascript
Javascript下IE与Firefox下的差异兼容写法总结
2010/06/18 Javascript
js调用css属性写法
2013/09/21 Javascript
javascript框架设计读书笔记之数组的扩展与修复
2014/12/02 Javascript
JavaScript与HTML的结合方法详解
2015/11/23 Javascript
谈谈JavaScript类型系统之Math
2016/01/06 Javascript
js实现可键盘控制的简单抽奖程序
2016/07/13 Javascript
vue2.0结合DataTable插件实现表格动态刷新的方法详解
2017/03/17 Javascript
iscroll动态加载数据完美解决方法
2017/07/18 Javascript
JS加密插件CryptoJS实现的DES加密示例
2018/08/16 Javascript
Element input树型下拉框的实现代码
2018/12/21 Javascript
layui 点击重置按钮, select 并没有被重置的解决方法
2019/09/03 Javascript
Python numpy实现二维数组和一维数组拼接的方法
2018/06/05 Python
Python 微信之获取好友昵称并制作wordcloud的实例
2019/02/21 Python
Python学习笔记之抓取某只基金历史净值数据实战案例
2019/06/03 Python
python opencv捕获摄像头并显示内容的实现
2019/07/11 Python
python list多级排序知识点总结
2019/10/23 Python
Pytoch之torchvision.transforms图像变换实例
2019/12/30 Python
Python综合应用名片管理系统案例详解
2020/01/03 Python
在keras中对单一输入图像进行预测并返回预测结果操作
2020/07/09 Python
BRASTY捷克:购买香水、化妆品、手袋和手表
2017/07/12 全球购物
德国著名廉价网上药店:Shop-Apotheke
2017/07/23 全球购物
FitFlop美国官网:英国符合人体工学的鞋类品牌
2018/10/05 全球购物
马来西亚最热门的在线时尚商店:FashionValet
2018/11/11 全球购物
屈臣氏俄罗斯在线商店:Watsons俄罗斯
2020/08/03 全球购物
一份文言文检讨书
2014/09/13 职场文书
2014年学生会工作总结
2014/11/07 职场文书
理想国读书笔记
2015/06/25 职场文书
《青山不老》教学反思
2016/02/22 职场文书