利用python进行文件操作


Posted in Python onDecember 04, 2020

作者: wyh草样

出处:https://www.cnblogs.com/wyh0923/p/14084898.html

什么是文件

文件是系统存储区域的一个命名位置,用来存储一些信息,便于后续访问。能够在非易失性存储器中实现持续性存储,比如在硬盘上。当我们要读取或者写入文件时,我们需要打开文件;在操作完毕时,我们需要关闭文件,以便释放和文件操作相关的系统资源,因此,文件操作的主要包括以下:

打开文件

  • 读取或者写入
  • 关闭文件
  • 打开文件

Python使用内置的open()函数打开一个文件,并且返回一个文件对象,也叫句柄(handle)。

f = open("test.txt") # 在本文件夹下面的一个文件
f = open("C:/Python33/README.txt") # 全路径

再打开文件时,我们需要指定文件打开的模式,当我们需要读取文件时,使用f = open("test.txt", 'r'),写入文件时,使用f = open("test.txt", 'w'),追加输入时f = open("test.txt", 'a'),这里的a就是append的意思。追加模式和写入模式的区别就是,写入模式打开一个文件时,无论这个文件是否有内容,都会被清空再写入;在使用追加模式时,打开的文件,只是在原有的内容上继续进行写入。同时我们也要制定以文本模式打开还是二进制模式打开。

文本模式(text mode)和二进制(binary mode)模式的区别

文本模式中,读取时操作系统的换行符('\n' on Unix,'\r\n' on Windows)会被转换成Python的默认换行符\n,写入时会将默认的换行符转换为操作系统的换行符;在二进制模式中不会转换。这个转化在对文本文件没有影响,但是对于二进制数据会有影响,比如图像文件或者EXE文件等。因此, 再打开这类文件时,一般使用二进制模式进行读写

常用模式

r 文本模式,读取
rb 二进制模式,读取
w 文本模式,写入
wb 二进制模式,写入
a 文本模式,追加
ab 二进制模式,追加
+ 可读可写
f = open("test.txt", 'r') # 读模式
f = open("test.txt", 'w') # 写模式
f = open("img.bmp",'r+') # 可读可写
f = open("img.bmp",'w+') # 可读可写
f = open("img.bmp",'rb') # 二进制读取

如何关闭文件

当文件操作结束时,我们最好主动关闭文件。尽管Python有垃圾回收(garbage collector)机制,去清理不用的对象,但是最好还是自己关闭文件。
最简单的方法就是:

f = open("app.log", 'r')
do_something()
f.close()

但是这个办法不安全,因为在进行其他操作时,可能会出现异常,程序退出,那么关闭文件的语句就不会被执行。
因此,可以用语句来处理:

try:
 f = open('app.log', 'r')
 do_something()
finally:
 f.close()

无论是否发生异常,关闭文件的指令都会被执行。
但是python官方给出的最佳用法是:

with open('app.log', 'r') as f:
 do_something()

使用这种用法,我们不必调用close()方法,在with语句程序内部就会执行,无论内部是否出现异常。with语句被称为上下文管理器,我们可以暂且不管这个的原理,只需要知道使用with语句,关闭文件的操作会被自动执行,这也是官方推荐的最佳用法,比用语句写起来简单。

文件操作

写入文件
主要介绍两个方法:

1.write()方法
这个方法的参数是一个单独的字符串,比如:

lines = ['line1', 'line2']
with open('filename.txt', 'w') as f:
 s = ''
 for data in lines:
  s += data
  s += '\n'
 f.write(s)

其实更好的写法是使用join函数:

lines = ['line1', 'line2']
with open('filename.txt', 'w') as f:
 f.write('\n'.join(lines))

其实更加优雅的写法,可以使用生成器:

lines = ['line1', 'line2']
with open('filename.txt', 'w') as f:
 f.writelines("%s\n" % l for l in lines)

读取文件

这里介绍四种用法,后面都默认文件已经被打开了:
1.read()方法

result = f.read()

这里返回的是文件内容,是str类型的结果,这个方法还带一个数值类型的参数,指定读取多少内容,如果省略了或者是负数,那么就返回文件的全部内容。
2.readline()方法

result = f.readline()

返回的也是字符串,不过是一行内容,继续调用,就会返回下一行内容
3.readlines()方法

result = f.readlines()

这里返回的是一个列表,但是当数据较大时,这样的用法会很占用内存,不推荐在数据量大时使用
4.直接循环文件对象

for line in f:
 print line
 do_something()

这样的用法节省内存,快速,并且代码还简单

result = f.readlines()
------------------------
result = list(f)

这两种写法返回的结果是一样的
显然我们推荐第四种用法。

如何处理大文件
大文件主要问题在于占用内存较大,我们不能一下子将文件全部内容读入内存,最好的做法如下:

with open("log.txt") as f:
 for line in f:
  do_something_with(line)

一行一行读取,内存不会爆,同时速度也更快,使用with语句,无论内部是否出现异常,在结束时,文件对象都会被关闭,因此在处理大文件时,最好这样来做。

以上就是利用python进行文件操作的详细内容,更多关于python 文件操作的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
Python中的两个内置模块介绍
Apr 05 Python
Python2.7编程中SQLite3基本操作方法示例
Aug 09 Python
Python cookbook(数据结构与算法)对切片命名清除索引的方法
Mar 13 Python
在windows下Python打印彩色字体的方法
May 15 Python
pandas数据清洗,排序,索引设置,数据选取方法
May 18 Python
python调用c++ ctype list传数组或者返回数组的方法
Feb 13 Python
pyqt远程批量执行Linux命令程序的方法
Feb 14 Python
python Manager 之dict KeyError问题的解决
Dec 21 Python
Python安装与卸载流程详细步骤(图解)
Feb 20 Python
Pycharm如何导入python文件及解决报错问题
May 10 Python
python 实现 hive中类似 lateral view explode的功能示例
May 18 Python
Python Socket TCP双端聊天功能实现过程详解
Jun 15 Python
Python爬虫之Selenium下拉框处理的实现
Dec 04 #Python
Python爬虫之Selenium警告框(弹窗)处理
Dec 04 #Python
Python爬虫之Selenium中frame/iframe表单嵌套页面
Dec 04 #Python
Python爬虫之Selenium多窗口切换的实现
Dec 04 #Python
Python爬虫之Selenium实现键盘事件
Dec 04 #Python
python 爬虫请求模块requests详解
Dec 04 #Python
Python爬虫之Selenium鼠标事件的实现
Dec 04 #Python
You might like
php设计模式 Builder(建造者模式)
2011/06/26 PHP
PHP 杂谈《重构-改善既有代码的设计》之三 重新组织数据
2012/04/09 PHP
微信支付开发动态链接Native支付
2016/07/12 PHP
php及codeigniter使用session-cookie的方法(详解)
2017/04/06 PHP
php读取和保存base64编码的图片内容
2017/04/22 PHP
php如何把表单内容提交到数据库
2019/07/08 PHP
Laravel 5+ .env环境配置文件详解
2020/04/06 PHP
javascript中的数字与字符串相加实例分析
2011/08/14 Javascript
jQuery点击自身以外地方关闭弹出层的简单实例
2013/12/24 Javascript
嵌入式iframe子页面与父页面js通信的方法
2015/01/20 Javascript
详解js中==与===的区别
2017/01/08 Javascript
简单的渐变轮播插件
2017/01/12 Javascript
深入理解Vue Computed计算属性原理
2018/05/29 Javascript
详解使用webpack+electron+reactJs开发windows桌面应用
2019/02/01 Javascript
在VUE中实现文件下载并判断状态的方法
2019/11/08 Javascript
微信小程序 获取手机号 JavaScript解密示例代码详解
2020/05/14 Javascript
Postman内建变量常用方法实例解析
2020/07/28 Javascript
Python3基础之输入和输出实例分析
2014/08/18 Python
利用Python绘制MySQL数据图实现数据可视化
2015/03/30 Python
python 文件转成16进制数组的实例
2018/07/09 Python
python ftp 按目录结构上传下载的实现代码
2018/09/12 Python
pandas中apply和transform方法的性能比较及区别介绍
2018/10/30 Python
Python2和Python3中urllib库中urlencode的使用注意事项
2018/11/26 Python
在Pycharm terminal中字体大小设置的方法
2019/01/16 Python
Python时间序列处理之ARIMA模型的使用讲解
2019/04/02 Python
Python Django 添加首页尾页上一页下一页代码实例
2019/08/21 Python
django3.02模板中的超链接配置实例代码
2020/02/04 Python
scrapy结合selenium解析动态页面的实现
2020/09/28 Python
手把手教你从PyCharm安装到激活(最新激活码),亲测有效可激活至2089年
2020/11/25 Python
Viking Direct荷兰:购买办公用品
2019/06/20 全球购物
公务员培训自我鉴定
2013/09/19 职场文书
医学院校毕业生自荐信范文
2014/01/01 职场文书
资料员岗位职责
2015/02/10 职场文书
Nginx tp3.2.3 404问题解决方案
2021/03/31 Servers
ant design charts 获取后端接口数据展示
2022/05/25 Javascript
HttpClient实现表单提交上传文件
2022/08/14 Java/Android