编程 Python

python3中编码获取网页的实例方法

Posted in Python onNovember 16, 2020

学了python后，之前一些我们常用的方法，也可以换一种思路用python中的知识来解决。相信操作出来后，能收获一大批小粉丝们。就像我们没学习编程之前，看到那种大神都是可望而不可即。今天我们就之前简单获取网页的这种操作用python中的编码来解决，大家可以自行体会一下两者的不同。

1. encoding和apparent_encoding

import scrapy
url="https://www.xxx.net/html/gndy/dyzz/index.html"
re=requests.get(url)
#获取响应头Content-Type的charset值，有的网站没有charset字段，就可能使用默认的 ISO-8859-1
print(re.encoding)
#apparent_encoding就是获取网站真实的编码
print(re.apparent_encoding)

2. 处理方案

直接用r.encoding = ‘xxx'

re.encoding='utf-8'

3. requests的text() 跟 content() 有什么区别

re.text返回的是处理过的Unicode型的数据，

而使用re.content返回的是bytes型的原始数据。

4. 爬虫拿到的HTML和浏览器中的源码不相同时

通过下载源码对比

import requests
url = 'https://www.xxx.net/html/gndy/dyzz/index.html'
r = requests.get(url)
r.encoding = r.apparent_encoding
html = r.text
with open('test.html','w',encoding='utf8') as f:
f.write(html)

python3中编码获取网页的实例方法

到此这篇关于python3中编码获取网页的实例方法的文章就介绍到这了,更多相关python3中编码如何获取网页内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木！

python3中编码获取网页的实例方法

- Author -

PYCN

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python标准库之collections包的使用教程

Apr 27 Python

Python基于回溯法子集树模板解决选排问题示例

Sep 07 Python

python 从csv读数据到mysql的实例

Jun 21 Python

Caffe均值文件mean.binaryproto转mean.npy的方法

Jul 09 Python

python实现停车管理系统

Nov 30 Python

Python面向对象基础入门之设置对象属性

Dec 11 Python

Python实现的拉格朗日插值法示例

Jan 08 Python

python3利用Socket实现通信的方法示例

May 06 Python

Python Socket TCP双端聊天功能实现过程详解

Jun 15 Python

django 装饰器检测登录状态操作

Jul 02 Python

Python延迟绑定问题原理及解决方案

Aug 04 Python

Python 多进程、多线程效率对比

Nov 19 Python

Python3中小括号()、中括号[]、花括号{}的区别详解

Nov 15 #Python

Python根据URL地址下载文件并保存至对应目录的实现

Nov 15 #Python

python re的findall和finditer的区别详解

Nov 15 #Python

Python获取android设备cpu和内存占用情况

Nov 15 #Python

Python __slots__的使用方法

Nov 15 #Python

Python descriptor(描述符)的实现

Nov 15 #Python

基于OpenCV的网络实时视频流传输的实现

Nov 15 #Python

You might like

使用PHP curl模拟浏览器抓取网站信息

2013/10/28 PHP

PHP数据库链接类(PDO+Access)实例分享

2013/12/05 PHP

PHP观察者模式示例【Laravel框架中有用到】

2018/06/15 PHP

Jquery replace 字符替换实现代码

2010/12/02 Javascript

js 静态动态成员 and 信息的封装和隐藏

2011/05/29 Javascript

Javascript类定义语法,私有成员、受保护成员、静态成员等介绍

2011/12/08 Javascript

ie8 不支持new Date(2012-11-10)问题的解决方法

2013/07/31 Javascript

Jquery EasyUI的添加，修改，删除，查询等基本操作介绍

2013/10/11 Javascript

引入JS文件IE6报语法错误或缺少对象问题的解决方法

2014/01/09 Javascript

jQuery中:not选择器用法实例

2014/12/30 Javascript

javascript获得当前的信息的一些常用命令

2015/02/25 Javascript

JavaScript中Function函数与Object对象的关系

2015/12/17 Javascript

解决vue组件中使用v-for出现告警问题及v for指令介绍

2017/11/11 Javascript

详解vue表单——小白速看

2018/04/08 Javascript

微信小程序实现简易table表格

2020/06/19 Javascript

记一次Vue.js混入mixin的使用(分权限管理页面)

2019/04/17 Javascript

JS实现横向轮播图（中级版）

2020/01/18 Javascript

vue 百度地图(vue-baidu-map)绘制方向箭头折线实例代码详解

2020/04/28 Javascript

Java 生成随机字符的示例代码

2021/01/13 Javascript

vue登录页实现使用cookie记住7天密码功能的方法

2021/02/18 Vue.js

Python本地与全局命名空间用法实例

2015/06/16 Python

解决Ubuntu pip 安装 mysql-python包出错的问题

2018/06/11 Python

Numpy截取指定范围内的数据方法

2018/11/14 Python

python引用(import)某个模块提示没找到对应模块的解决方法

2019/01/19 Python

Python将列表数据写入文件（txt, csv，excel）

2019/04/03 Python

python socket通信编程实现文件上传代码实例

2019/12/14 Python

推荐8款常用的Python GUI图形界面开发框架

2020/02/23 Python

Pytorch通过保存为ONNX模型转TensorRT5的实现

2020/05/25 Python

Html5定位终极解决方案

2020/02/05 HTML / CSS

Ralph Lauren拉夫·劳伦美国官网：带有浓郁美国气息的高品味时装品牌

2017/11/01 全球购物

linux面试题参考答案（6）

2014/08/29 面试题

总会计师岗位职责

2014/02/19 职场文书

环保专项行动方案

2014/05/12 职场文书

党员个人公开承诺书

2014/08/29 职场文书

2014群众路线学习笔记

2014/11/06 职场文书

PostgreSQL并行计算算法及参数强制并行度设置方法

2022/04/06 PostgreSQL