Python入门篇之文件


Posted in Python onOctober 20, 2014

文件处理的函数和方法

使用Open()函数可打开文件,语法格式如下:

file_handler = open(filename,[,mode[,bufsize]]

filename是你要操作的文件名,如果不在当前路径,需指出具体路径。mode是打开文件的模式,表示你要如何操作文件,bufsize表示是否使用缓存。

mode

 

模式 描述
r 以读方式打开文件,可读取文件信息。
w 以写方式打开文件,可向文件写入信息。
a 以追加方式打开文件,文件指针自动移到文件尾。
r+ 以读写方式打开文件,可对文件进行读和写操作。
w+ 消除文件内容,然后以读写方式打开文件。
a+ 以读写方式打开文件,并把文件指针移到文件尾。
b 以二进制模式打开文件,而不是以文本模式。该模式只对Windows或Dos有效,类Unix的文件是用二进制模式进行操作的。

bufsize

bufsize取值 描述
0 禁用缓冲
1 行缓冲
>1 指定缓冲区的大小
系统默认的缓冲区大小
 

open()函数返回一个文件对象,我们可通过read()或write()函数对文件进行读写操作,下面是一些文件对象方法:

文件对象方法

方法 描述
f.close() 关闭文件,记住用open()打开文件后一定要记得关闭它,否则会占用系统的可打开文件句柄数。
f.fileno() 获得文件描述符
f.flush() 刷新输出缓存
f.isatty() 如果文件是一个交互终端,则返回True,否则返回False。
f.read([count]) 读出文件,如果有count,则读出count个字节。
f.readline() 读出一行信息。
f.readlines() 读出所有行,也就是读出整个文件的信息。
f.seek(offset[,where]) 把文件指针移动到相对于where的offset位置。offset为0表示文件开始处,这是默认值 ;1表示当前位置;2表示文件结尾。
f.tell() 获得文件指针位置。
f.truncate([size]) 截取文件,使文件的大小为size。
f.write(string) 把string字符串写入文件。
f.writelines(list) 把list中的字符串一行一行地写入文件。
 

示例

1.文件的打开或创建

#!/usr/bin/env python

#-*- encoding:UTF-8 -*-
filehandler = open('test.txt','w')               #以写模式打开文件,如果文件不存在则创建

filehandler.write('this is a file open/create test.\nthe second line.')
filehandler.close()

#!/usr/bin/env python

#-*- encoding:UTF-8 -*-
filehandler = open('test.txt','a')      #以追加模式打开文件,如果文件不存在则创建
filehandler.write('\nappend the text in another line.\n')
filehandler.close()

2.读取文件

#!/usr/bin/env python

#-*- encoding:UTF-8 -*-
filehandler = open('test.txt','r')    #以读方式打开文件,rb为二进制方式(如图片或可执行文件等)

 

print 'read() function:'              #读取整个文件

print filehandler.read()

 

print 'readline() function:'          #返回文件头,读取一行

filehandler.seek(0)

print filehandler.readline()

 

print 'readlines() function:'         #返回文件头,返回所有行的列表

filehandler.seek(0)

print filehandler.readlines()

 

print 'list all lines'                #返回文件头,显示所有行

filehandler.seek(0)

textlist = filehandler.readlines()

for line in textlist:

      print line
print 'seek() function'               #移位到第32个字符,从33个字符开始显示余下内容

filehandler.seek(32)

print filehandler.read()
print 'tell() function'               #移位到文件头,从头开始显示2位字符

filehandler.seek(0)

print filehandler.readline()          #显示第一行内容

print filehandler.tell()              #显示当前位置

print filehandler.readline()          #显示第二行内容

print filehandler.read()              #显示余下所有内容
filehandler.close()                   #关闭文件句柄

3.文件系统操作

#!/usr/bin/env python

#-*- encoding:utf-8 -*-
import os,fnmatch,glob
for fileName in os.listdir ( '/root' ):                 #列出/root目录内容,不包括.和..

   print fileName
os.mkdir('py')                  #在当前目录下创建一个py目录,且只能创建一层

os.rmdir( 'py')                 #在当前目录下删除py目录,且只能删除一层

os.makedirs('py/aa')            #可创建多层目录

os.removedirs('py/aa')          #可删除多层目录


print 'demonstration fnmatch module'                 

for fileName in os.listdir ( '/root/python/file' ):

        if fnmatch.fnmatch(fileName,'*.txt'):        #利用UNIX风格的通配,只显示后缀为txt的文件

                print fileName
print 'demonstration glob module'

for fileName in glob.glob ( '*.txt' ):               #利用UNIX风格的通配,只显示后缀为txt的文件

        print fileName

4.获取文件状态

#!/usr/bin/env python

#-*- encoding:UTF-8 -*-
import os,time,stat
fileStats = os.stat ( 'test.txt' )                         #获取文件/目录的状态

fileInfo = {

'Size':fileStats [ stat.ST_SIZE ],                         #获取文件大小

'LastModified':time.ctime( fileStats [ stat.ST_MTIME ] ),  #获取文件最后修改时间

'LastAccessed':time.ctime( fileStats [ stat.ST_ATIME ] ),  #获取文件最后访问时间

'CreationTime':time.ctime( fileStats [ stat.ST_CTIME ] ),  #获取文件创建时间

'Mode':fileStats [ stat.ST_MODE ]                          #获取文件的模式

}

#print fileInfo
for field in fileInfo:                                     #显示对象内容

        print '%s:%s' % (field,fileInfo[field])
#for infoField,infoValue in fileInfo:

#       print '%s:%s' % (infoField,infoValue)

if stat.S_ISDIR ( fileStats [ stat.ST_MODE ] ):             #判断是否路径

        print 'Directory. '

else:

        print 'Non-directory.'
if stat.S_ISREG ( fileStats [ stat.ST_MODE ] ):             #判断是否一般文件

   print 'Regular file.'

elif stat.S_ISLNK ( fileStats [ stat.ST_MODe ] ):           #判断是否链接文件

   print 'Shortcut.'

elif stat.S_ISSOCK ( fileStats [ stat.ST_MODe ] ):          #判断是否套接字文件     

   print 'Socket.'

elif stat.S_ISFIFO ( fileStats [ stat.ST_MODe ] ):          #判断是否命名管道

   print 'Named pipe.'

elif stat.S_ISBLK ( fileStats [ stat.ST_MODe ] ):           #判断是否块设备

   print 'Block special device.'

elif stat.S_ISCHR ( fileStats [ stat.ST_MODe ] ):           #判断是否字符设置

   print 'Character special device.'

#!/usr/bin/env python

#-*- encoding:UTF-8 -*-
import os.path
fileStats = 'test.txt'
if os.path.isdir ( fileStats ):         #判断是否路径

        print 'Directory.'

elif os.path.isfile ( fileStats ):      #判断是否一般文件

        print 'File.'

elif os.path.islink ( fileStats ):      #判断是否链接文件

        print 'Shortcut.'

elif os.path.ismount ( fileStats ):     #判断是否挂接点

        print 'Mount point.'

stat模块描述了os.stat(filename)返回的文件属性列表中各值的意义。我们可方便地根据stat模块存取os.stat()中的值。

5.串行化文件

#!/usr/bin/env python

#-*- encoding:UTF-8 -*-
import pickle
filehandler = open('pickle.txt','w')
text = ['this is a pickle demonstrate','aa','bb']
pickle.dump(text,filehandler)           #把text的内容序列化后保存到pickle.txt文件中
filehandler.close()
filehandler2 = open('pickle.txt')
textlist = pickle.load(filehandler2)    #还原序列化字符串

print textlist
filehandler2.close()
#cpickle是用C写的pickle模块,比标准的pickle速度快很多,使用方法同pickle。

6.内存文件

#!/usr/bin/env python

#-*- coding: utf-8 -*-
import StringIO
fileHandle = StringIO.StringIO ( "Let freedom ring." )   #create file in memory
print fileHandle.read() # "Let freedom ring."
fileHandle.close()
#cStringIO是用C写的StringIO模块,执行速度比StringIO快。

shutil模块是一个高级的文件处理模块,可实现文件的拷贝、删除等操作。

打开文件
打开文件程序会调用内置的open函数,首先是外部名,接着就是处理模式。

常见的文件运算:

 Python入门篇之文件

在任何情况下,Python程序中的文本文件采用字符串的形式,读取文本时会返回字符串形式的文本

从文件中读取的数据回到脚本时是一个字符串,所以如果字符串不是你所需的,就得将其转换成其他类型的Python对象

实际应用中的文件
首先看一个文件处理的一个简单的例子:

>>> myfile=open('myfile','w')

>>> myfile.write('hello,myfile!\n')

>>> myfile.close()

>>> myfile=open('myfile')

>>> myfile.readline()

'hello,myfile!\n'

>>> myfile.readline()

''

把一行文本写成字符串,包含行终止符\n,写入方法不会为我们添加行终止符

在文件中存储并解析Python对象
必须使用转换工具把对象转换成字符串,注意文件数据在脚本中一定是字符串,而写入方法不会自动地替我们做任何向字符串格式转换的工作

>>> X,Y,Z=43,324,34

>>> S='Spam'

>>> D={'a':1,'b':2}

>>> L=[1,2,3]

>>> F=open('datafile.txt','w')

>>> F.write(S+'\n')

>>> F.write('%s,%s,%s\n'%(X,Y,Z))

>>> F.write(str(L)+'$'+str(D)+'\n')

>>> F.close()

一旦我们创建了文件爱你就可以通过打开和读取字符串来查看文件的内容,而print语句则会解释内嵌行终止符来给用户满意的结果:

>>> bytes=open('datafile.txt').read()

>>> bytes

"Spam\n43,324,34\n[1, 2, 3]${'a': 1, 'b': 2}\n"

>>> print bytes

Spam

43,324,34

[1, 2, 3]${'a': 1, 'b': 2}

鉴于Python不会自动把字符串转换为数字或其他类型的对象,需要使用诸如索引、加法等普通对象工具

>>> F=open('datafile.txt')

>>> line=F.readline()

>>> line

'Spam\n'

>>> line=F.readline()

>>> line

'43,324,34\n'

>>> parts=line.split(',')

>>> parts

['43', '324', '34\n']

>>> int(parts[1])

324

>>> numbers=[int(p) for p in parts]

>>> numbers

[43, 324, 34]

>>> line=F.readline()

>>> line

"[1, 2, 3]${'a': 1, 'b': 2}\n"

>>> parts=line.split('$')

>>> parts

['[1, 2, 3]', "{'a': 1, 'b': 2}\n"]

>>> eval(parts[0])

[1, 2, 3]

>>> objects=[eval(p) for p in parts]

>>> objects

[[1, 2, 3], {'a': 1, 'b': 2}]

用pickle存储Python的原生对象
使用eval可以把字符串转换成对象,pickle模块是能够让我们直接在文件中存储几乎任何Python对象的高级工具,并不要求把字符串转换来转换去

>>> F=open('datafile.txt','w')

>>> import pickle

>>> pickle.dump(D,F)

>>> F.close()

>>> F=open('datafile.txt')

>>> E=pickle.load(F)

>>> E

{'a': 1, 'b': 2}

pickle模块执行所谓的对象序列化,也就是对象和字节字符串之间的互相转换

Python 相关文章推荐
Python入门篇之编程习惯与特点
Oct 17 Python
python字典排序实例详解
May 20 Python
python实现八大排序算法(2)
Sep 14 Python
浅谈python迭代器
Nov 08 Python
python获取时间及时间格式转换问题实例代码详解
Dec 06 Python
Python 中Django安装和使用教程详解
Jul 03 Python
python使用 cx_Oracle 模块进行查询操作示例
Nov 28 Python
pytorch 实现在预训练模型的 input上增减通道
Jan 06 Python
pytorch 状态字典:state_dict使用详解
Jan 17 Python
python实现简单俄罗斯方块
Mar 13 Python
TensorFlow-gpu和opencv安装详细教程
Jun 30 Python
python tkinter模块的简单使用
Apr 07 Python
Python入门篇之函数
Oct 20 #Python
Python入门篇之条件、循环
Oct 17 #Python
Python入门篇之字典
Oct 17 #Python
Python入门篇之字符串
Oct 17 #Python
Python入门篇之列表和元组
Oct 17 #Python
Python入门篇之对象类型
Oct 17 #Python
Python入门篇之编程习惯与特点
Oct 17 #Python
You might like
php防盗链的常用方法小结
2010/07/02 PHP
PHP实现对站点内容外部链接的过滤方法
2014/09/10 PHP
php如何执行非缓冲查询API
2016/07/22 PHP
Git命令之分支详解
2021/03/02 PHP
js 页面执行时间计算代码
2009/03/04 Javascript
Exitjs获取DataView中图片文件名
2009/11/26 Javascript
javascript实现TreeView 无刷新展开的实例代码
2013/07/13 Javascript
JSON 数字排序多字段排序介绍
2013/09/18 Javascript
JavaScript动态插入script的基本思路及实现函数
2013/11/11 Javascript
iframe子页面与父页面在同域或不同域下的js通信
2014/05/07 Javascript
自定义jquery模态窗口插件无法在顶层窗口显示问题
2014/05/29 Javascript
使用angular写一个hello world
2015/01/23 Javascript
js设置document.domain实现跨域的注意点分析
2015/05/21 Javascript
jQuery聚合函数实例
2015/05/21 Javascript
充分发挥Node.js程序性能的一些方法介绍
2015/06/23 Javascript
JavaScript检测上传文件大小的方法
2015/07/22 Javascript
详解Angularjs中的依赖注入
2016/03/11 Javascript
AngularJS Ajax详解及示例代码
2016/08/17 Javascript
react.js 父子组件数据绑定实时通讯的示例代码
2017/09/25 Javascript
vue2.0路由切换后页面滚动位置不变BUG的解决方法
2018/03/14 Javascript
实现一个 Vue 吸顶锚点组件方法
2019/07/10 Javascript
javascript设计模式 ? 代理模式原理与用法实例分析
2020/04/16 Javascript
python抓取最新博客内容并生成Rss
2015/05/17 Python
Python带动态参数功能的sqlite工具类
2018/05/26 Python
使用python Fabric动态修改远程机器hosts的方法
2018/10/26 Python
Python tornado上传文件的功能
2020/03/26 Python
纯DOM+CSS3实现简单的小风车动画
2016/09/27 HTML / CSS
纯CSS3实现圆角效果(含IE兼容解决方法)
2014/05/07 HTML / CSS
canvas绘制表情包的示例代码
2018/07/09 HTML / CSS
Canvas实现保存图片到本地的示例代码
2018/06/28 HTML / CSS
办公自动化毕业生求职信
2014/03/09 职场文书
诉讼代理人授权委托书
2014/04/08 职场文书
应届大专生自荐书
2014/06/16 职场文书
地理信息科学专业推荐信
2014/09/08 职场文书
SQL实现LeetCode(177.第N高薪水)
2021/08/04 MySQL
MYSQL 的10大经典优化案例场景实战
2021/09/14 MySQL