编程 Python

浅析Python 字符编码与文件处理

Posted in Python onSeptember 24, 2020

Python字符编码

目前计算机内存的字符编码都是Unicode，目前国内的windows操作系统采用的是gbk。

python2默认的字符编码方式是ASCII

python3默认的字符编码方式是Unicode

.py文件头部的#coding:utf-8是帮助python识别.py文件的编码方式，故在写.py文件时要注意文件头和文件保存时的编码方式要相同，否则可能会出现乱码

python程序运行过程:

python的解释器现在内存中启动
解释器把要运行的文件以文本文件的形式读进内存
解释器按照文件的语法格式解释执行代码

python2和python3程序的运行方式基本相同

python2的解释器在运行程序时，将文件内的代码按照文件头的编码读进内存。例如文件头部的编码是gbk，python2读进内存的时候，直接把文件在硬盘里的gbk二进制编码读进内存。如果在不是以gbk为默认编码的终端输出时，会出现乱码。python2可以在字符串对象前加'u'表示Unicode字符，但是这样就不是str变量了。虽然pyhton2也能支持Unicode编码，但是这就像给python2打了一个大补丁。python2的Unicode对象就是python3str对象。

python3的解释器就好多了，它在执行文件内的代码之前会先将代码按照文件头的编码转换成Unicode编码读进内存。这样无论是在什么编码的机器上运行，Unicode编码都能很好的转换成相应的编码。

Python 文件处理

python程序不能直接操作硬盘的文件，一般都是通过操作系统提供的接口间接地操作文件。

一般来说，对文件的操作的mode有两种，t：字符方式 b：二进制方式

字符方式只能操作文本文件，在打开文件的时候需要指定encoding，不然会因为短句不准确产生乱码

二进制方式可以操作所有的文件，在打开文件的时候不要指定encoding

操作完文件后调用文件对象的close()函数会关闭文件，这只是关闭操作系统对文件的访问，在程序里文件对象会在程序结束的时候自动释放，所以在操作文件结束后，记得调用close()函数，释放系统资源。当然可以用with上下文管理自动释放资源。

以上就是浅析Python 字符编码与文件处理的详细内容，更多关于Python 字符编码与文件处理的资料请关注三水点靠木其它相关文章！

浅析Python 字符编码与文件处理

- Author -

Wuliwawa

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python HTMLParser模块解析html获取url实例

Apr 08 Python

Python编写生成验证码的脚本的教程

May 04 Python

Python增量循环删除MySQL表数据的方法

Sep 23 Python

Python3操作SQL Server数据库(实例讲解)

Oct 21 Python

python多进程下实现日志记录按时间分割

Jul 22 Python

Python pandas用法最全整理

Aug 04 Python

python加密解密库cryptography使用openSSL生成的密匙加密解密

Feb 11 Python

pycharm 设置项目的根目录教程

Feb 12 Python

python实现从尾到头打印单链表操作示例

Feb 22 Python

python 链接sqlserver 写接口实例

Mar 11 Python

详解python中的异常捕获

Dec 15 Python

Python3爬虫ChromeDriver的安装实例

Feb 06 Python

学生如何注册Pycharm专业版以及pycharm的安装

Sep 24 #Python

python判断元素是否存在的实例方法

Sep 24 #Python

python 实现单例模式的5种方法

Sep 23 #Python

python zip()函数的使用示例

Sep 23 #Python

python 判断一组数据是否符合正态分布

Sep 23 #Python

python合并多个excel文件的示例

Sep 23 #Python

详解Python yaml模块

Sep 23 #Python