Python 文件数据读写的具体实现


Posted in Python onJanuary 24, 2020

文件数据读写

读写文件,本质上是请求操作系统打开一个文件对象,然后,通过操作系统提供的接口从这个文件对象中读取数据(读文件),或者把数据写入这个文件对象(写文件)。

文件读取

使用 Python 内置 open() 函数,以 rt 的模式读取文件,如下示例:

>>> f = open('some.txt', 'rt')

这行代码就表示打开一个文件,若是文件不存在,会抛出 IOError 的异常,并给出详细的信息提示:

>>> f = open('undefined.txt', 'rt')
Traceback (most recent call last):
 File "<stdin>", line 1, in <module>
FileNotFoundError: [Errno 2] No such file or directory: 'undefined.txt'

当成功打开文件时,可使用 read() 函数读取文件的内容:

>>> f.read()
'Hello world!'

当数据读取完毕后,需要调用 close() 关闭文件。因为文件对象会占用资源,使用完毕后需要及时关闭释放资源。

>>> f.close()

还有一种方法就是使用 with 语句,给被使用的文件创建一个上下文环境,这样文件对象就能够自动关闭。

>>> with open('some.txt', 'rt') as f:
...   data = f.read()
...

调用 read() 时一次性读取全部内容,若是文件内容过大,可以使用 read(size) 固定大小循环读取,每次最多读取 size 字节的内容。readline() 函数,每次读取一行内容,readlines() 读取所有内容,但是按行返回 list。三者的使用,可根据实际的需求进行选择。

二进制文件

读取二进制的文件,需要使用 rb 的模式打开:

>>> f = open('image.jpg', 'rb')
>>> f.read()
b'\xff\xd8\xff\xe0\x00\x10JFIF\x00...'

从文件中读取数据,需要注意编码的问题。当编码错误时,会抛出 UnicodeDecodeError 异常。比如:

>>> f = open('some.txt', 'rt', encoding='ascii')
>>> f.read()
Traceback (most recent call last):
 File "<stdin>", line 1, in <module>
 File "/usr/local/lib/python3.6/encodings/ascii.py", line 26, in decode    
  return codecs.ascii_decode(input, self.errors)[0]
UnicodeDecodeError: 'ascii' codec can't decode byte 0xcc in position 2: ordinal not in range(128)

这种情况下,通常为读取文本指定的编码不正确,需要确认文件编码是否正确。如果编码错误还是存在的话,可以给 open() 函数传递一个可选的 errors 参数来处理这些错误。比如:

>>> f = open('some.txt', 'rt', encoding='ascii', errors='replace') 
>>> f.read()
'Un��ic��o��de��'
>>> f = open('some.txt', 'rt', encoding='ascii', errors='ignore') 
>>> f.read()
'Unicode'

使用参数 errors 能够处理编码错误的问题,但是过程会觉得非常糟糕。这里提倡的是确保使用的是正确的编码。模棱两可的时候,使用默认的设置(通常是 UTF-8)。

压缩文件

读取 gzip 和 bz2 格式的压缩文件时,可以使用 gzip 和 bz2 模块。两个模块都为 open() 提供了另外的实现来解决读取 gzip 和 bz2 两个格式的压缩文件的问题。例如读取压缩文件,示例如下:

>>> import gzip
>>> with gzip.open('some.gz', 'rt') as f: 
...   text=f.read()
   
>>> import bz2
>>> with bz2.open('some.bz2', 'rt') as f:
...   text=f.read()

文件写入

文件写入,同样需要调用 open() 参数,但是指定的模式为 wt 或者 wb,用以表示写文本文件或是二进制文件:

>>> f = open('some.txt', 'wt')
>>> f.write('Hello, world!')
13
>>> f.close()

数据写入完毕,同样需要调用 close() 关闭文件对象。也可以 with 语句创建上下文,用以正常关闭文件对象。

类似的,写入压缩数据时,导入 gzip 或者 bz2 模块:

>>> import gzip
>>> with gzip.open('some.gz', 'wt') as f: 
...   f.write(text)
   
>>> import bz2
>>> with bz2.open('some.bz2', 'wt') as f:
...   f.write(text)

写入压缩数据时,可选参数 compresslevel 可以指定一个压缩等级。例如:

>>> with gzip.open('some.gz', 'wt', compresslevel=6) as f:
...   f.write(text)

compresslevel 参数默认值为 9,表示最高的压缩等级。等级越低性能越好,但是压缩程度也就越低。

使用 w 模式的 open() 函数,若打开的文件在写入前有数据内容,则会被清除覆盖。如果是要在已经存在的文件中添加内容的话,使用模式为 at 的 open() 函数。

涉及读写文件模式的定义及含义,内容如下:

模式 含义
'r' 读取数据(默认)
'w' 写入数据
'x' 文件存在抛出异常,不存在则创建
'a' 追加写入数据
'b' 二进制模式
't' 文本模式(默认)
'+' 更新文件(读写)

具体更详细的内容可以参考 Python 官方文档。

参考资料

来源
David M. Beazley;Brian K. Jones.Python Cookbook, 3rd Edtioni.O'Reilly Media.2013.
Luciano Ramalho.Fluent Python.O'Reilly Media.2015.
“2. Built-in Functions”.docs.python.org.Retrieved 20 January 2020.
"gzip — Support for gzip files".docs.python.org.Retrieved 22 January 2020.
"bz2 — Support for bzip2 compression".docs.python.org.Retrieved 22 January 2020.
廖雪峰.“Python 教程”.liaoxuefeng.com.[2020-01-18].

以上为本篇的主要内容。希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python实现巡检系统(solaris)示例
Apr 02 Python
python在windows下实现备份程序实例
Jul 04 Python
Python随机生成均匀分布在三角形内或者任意多边形内的点
Dec 14 Python
python实现隐马尔科夫模型HMM
Mar 25 Python
python3+PyQt5实现自定义流体混合窗口部件
Apr 24 Python
python获取url的返回信息方法
Dec 17 Python
Python使用Beautiful Soup爬取豆瓣音乐排行榜过程解析
Aug 15 Python
对python中 math模块下 atan 和 atan2的区别详解
Jan 17 Python
使用Python将图片转正方形的两种方法实例代码详解
Apr 29 Python
Python无损压缩图片的示例代码
Aug 06 Python
python调用ffmpeg命令行工具便捷操作视频示例实现过程
Nov 01 Python
Python实现位图分割的效果
Nov 20 Python
利用keras加载训练好的.H5文件,并实现预测图片
Jan 24 #Python
keras模型可视化,层可视化及kernel可视化实例
Jan 24 #Python
keras 特征图可视化实例(中间层)
Jan 24 #Python
基于keras输出中间层结果的2种实现方式
Jan 24 #Python
tensorflow 保存模型和取出中间权重例子
Jan 24 #Python
tensorflow 模型权重导出实例
Jan 24 #Python
在Tensorflow中查看权重的实现
Jan 24 #Python
You might like
使用数据库保存session的方法
2006/10/09 PHP
PHP header函数分析详解
2011/08/06 PHP
Laravel5中contracts详解
2015/03/02 PHP
浅谈PHP的排列组合(如输入a,b,c 输出他们的全部组合)
2017/03/14 PHP
php实现多维数组排序的方法示例
2017/03/23 PHP
php多文件打包下载的实例代码
2017/07/12 PHP
jquery 触发a链接点击事件解决方案
2013/05/02 Javascript
基于jquery自定义的漂亮单选按钮RadioButton
2013/11/19 Javascript
如何正确使用Nodejs 的 c++ module 链接到 OpenSSL
2014/08/03 NodeJs
原生js实现自由拖拽弹窗代码demo
2016/06/29 Javascript
Webpack执行命令参数详解
2017/06/17 Javascript
解决iview打包时UglifyJs报错的问题
2018/03/07 Javascript
vue实现tab切换外加样式切换方法
2018/03/16 Javascript
JavaScript继承定义与用法实践分析
2018/05/28 Javascript
解决vue加scoped后就无法修改vant的UI组件的样式问题
2020/09/07 Javascript
[02:56]DOTA2矮人直升机 英雄基础教程
2013/11/26 DOTA
[37:21]完美世界DOTA2联赛PWL S2 Inki vs Magma 第二场 11.22
2020/11/24 DOTA
跟老齐学Python之让人欢喜让人忧的迭代
2014/10/02 Python
用实例分析Python中method的参数传递过程
2015/04/02 Python
利用Python获取赶集网招聘信息前篇
2016/04/18 Python
python编程线性回归代码示例
2017/12/07 Python
利用Python批量提取Win10锁屏壁纸实战教程
2018/03/27 Python
python实现上传文件到linux指定目录的方法
2020/01/03 Python
如何通过Django使用本地css/js文件
2020/01/20 Python
基于python生成英文版词云图代码实例
2020/05/16 Python
Python爬虫如何破解JS加密的Cookie
2020/11/19 Python
元宵节晚会主持人串词
2014/03/25 职场文书
民族团结先进集体事迹材料
2014/05/22 职场文书
读书月活动方案
2014/05/22 职场文书
银行纠风工作实施方案
2014/06/08 职场文书
年度优秀员工获奖感言
2014/08/15 职场文书
小区保洁员岗位职责
2015/04/10 职场文书
80后创业总结的9条职场用人思想,记得收藏
2019/08/13 职场文书
超级详细实用的pycharm常用快捷键
2021/05/12 Python
让文件路径提取变得更简单的Python Path库
2021/05/27 Python
Spring Boot实战解决高并发数据入库之 Redis 缓存+MySQL 批量入库问题
2022/02/12 Redis