python3中编码获取网页的实例方法


Posted in Python onNovember 16, 2020

学了python后,之前一些我们常用的方法,也可以换一种思路用python中的知识来解决。相信操作出来后,能收获一大批小粉丝们。就像我们没学习编程之前,看到那种大神都是可望而不可即。今天我们就之前简单获取网页的这种操作用python中的编码来解决,大家可以自行体会一下两者的不同。

1. encoding和apparent_encoding

import scrapy
url="https://www.xxx.net/html/gndy/dyzz/index.html"
re=requests.get(url)
#获取响应头Content-Type的charset值,有的网站没有charset字段,就可能使用默认的 ISO-8859-1
print(re.encoding)
#apparent_encoding就是获取网站真实的编码
print(re.apparent_encoding)

2. 处理方案

直接用r.encoding = ‘xxx'

re.encoding='utf-8'

3. requests的text() 跟 content() 有什么区别

re.text返回的是处理过的Unicode型的数据,

而使用re.content返回的是bytes型的原始数据。

4. 爬虫拿到的HTML和浏览器中的源码不相同时

通过下载源码对比

import requests
url = 'https://www.xxx.net/html/gndy/dyzz/index.html'
r = requests.get(url)
r.encoding = r.apparent_encoding
html = r.text
with open('test.html','w',encoding='utf8') as f:
f.write(html)

 python3中编码获取网页的实例方法

到此这篇关于python3中编码获取网页的实例方法的文章就介绍到这了,更多相关python3中编码如何获取网页内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python标准库之collections包的使用教程
Apr 27 Python
Python基于回溯法子集树模板解决选排问题示例
Sep 07 Python
python 从csv读数据到mysql的实例
Jun 21 Python
Caffe均值文件mean.binaryproto转mean.npy的方法
Jul 09 Python
python实现停车管理系统
Nov 30 Python
Python面向对象基础入门之设置对象属性
Dec 11 Python
Python实现的拉格朗日插值法示例
Jan 08 Python
python3利用Socket实现通信的方法示例
May 06 Python
Python Socket TCP双端聊天功能实现过程详解
Jun 15 Python
django 装饰器 检测登录状态操作
Jul 02 Python
Python延迟绑定问题原理及解决方案
Aug 04 Python
Python 多进程、多线程效率对比
Nov 19 Python
Python3中小括号()、中括号[]、花括号{}的区别详解
Nov 15 #Python
Python根据URL地址下载文件并保存至对应目录的实现
Nov 15 #Python
python re的findall和finditer的区别详解
Nov 15 #Python
Python获取android设备cpu和内存占用情况
Nov 15 #Python
Python __slots__的使用方法
Nov 15 #Python
Python descriptor(描述符)的实现
Nov 15 #Python
基于OpenCV的网络实时视频流传输的实现
Nov 15 #Python
You might like
使用PHP curl模拟浏览器抓取网站信息
2013/10/28 PHP
PHP数据库链接类(PDO+Access)实例分享
2013/12/05 PHP
PHP观察者模式示例【Laravel框架中有用到】
2018/06/15 PHP
Jquery replace 字符替换实现代码
2010/12/02 Javascript
js 静态动态成员 and 信息的封装和隐藏
2011/05/29 Javascript
Javascript类定义语法,私有成员、受保护成员、静态成员等介绍
2011/12/08 Javascript
ie8 不支持new Date(2012-11-10)问题的解决方法
2013/07/31 Javascript
Jquery EasyUI的添加,修改,删除,查询等基本操作介绍
2013/10/11 Javascript
引入JS文件IE6报语法错误或缺少对象问题的解决方法
2014/01/09 Javascript
jQuery中:not选择器用法实例
2014/12/30 Javascript
javascript获得当前的信息的一些常用命令
2015/02/25 Javascript
JavaScript中Function函数与Object对象的关系
2015/12/17 Javascript
解决vue组件中使用v-for出现告警问题及v for指令介绍
2017/11/11 Javascript
详解vue表单——小白速看
2018/04/08 Javascript
微信小程序实现简易table表格
2020/06/19 Javascript
记一次Vue.js混入mixin的使用(分权限管理页面)
2019/04/17 Javascript
JS实现横向轮播图(中级版)
2020/01/18 Javascript
vue 百度地图(vue-baidu-map)绘制方向箭头折线实例代码详解
2020/04/28 Javascript
Java 生成随机字符的示例代码
2021/01/13 Javascript
vue登录页实现使用cookie记住7天密码功能的方法
2021/02/18 Vue.js
Python本地与全局命名空间用法实例
2015/06/16 Python
解决Ubuntu pip 安装 mysql-python包出错的问题
2018/06/11 Python
Numpy截取指定范围内的数据方法
2018/11/14 Python
python引用(import)某个模块提示没找到对应模块的解决方法
2019/01/19 Python
Python将列表数据写入文件(txt, csv,excel)
2019/04/03 Python
python socket通信编程实现文件上传代码实例
2019/12/14 Python
推荐8款常用的Python GUI图形界面开发框架
2020/02/23 Python
Pytorch通过保存为ONNX模型转TensorRT5的实现
2020/05/25 Python
Html5定位终极解决方案
2020/02/05 HTML / CSS
Ralph Lauren拉夫·劳伦美国官网:带有浓郁美国气息的高品味时装品牌
2017/11/01 全球购物
linux面试题参考答案(6)
2014/08/29 面试题
总会计师岗位职责
2014/02/19 职场文书
环保专项行动方案
2014/05/12 职场文书
党员个人公开承诺书
2014/08/29 职场文书
2014群众路线学习笔记
2014/11/06 职场文书
PostgreSQL并行计算算法及参数强制并行度设置方法
2022/04/06 PostgreSQL