Python实现分割文件及合并文件的方法


Posted in Python onJuly 10, 2015

本文实例讲述了Python实现分割文件及合并文件的方法。分享给大家供大家参考。具体如下:

分割文件split.py如下:

#!/usr/bin/python
##########################################################################
# split a file into a set of parts; join.py puts them back together;
# this is a customizable version of the standard unix split command-line 
# utility; because it is written in Python, it also works on Windows and
# can be easily modified; because it exports a function, its logic can 
# also be imported and reused in other applications;
##########################################################################
import sys, os
kilobytes = 1024
megabytes = kilobytes * 1000
chunksize = int(1.4 * megabytes)     # default: roughly a floppy
def split(fromfile, todir, chunksize=chunksize): 
 if not os.path.exists(todir):     # caller handles errors
  os.mkdir(todir)       # make dir, read/write parts
 else:
  for fname in os.listdir(todir):   # delete any existing files
   os.remove(os.path.join(todir, fname)) 
 partnum = 0
 input = open(fromfile, 'rb')     # use binary mode on Windows
 while 1:          # eof=empty string from read
  chunk = input.read(chunksize)    # get next part <= chunksize
  if not chunk: break
  partnum = partnum+1
  filename = os.path.join(todir, ('part%04d' % partnum))
  fileobj = open(filename, 'wb')
  fileobj.write(chunk)
  fileobj.close()       # or simply open().write()
 input.close()
 assert partnum <= 9999       # join sort fails if 5 digits
 return partnum
if __name__ == '__main__':
 if len(sys.argv) == 2 and sys.argv[1] == '-help':
  print 'Use: split.py [file-to-split target-dir [chunksize]]'
 else:
  if len(sys.argv) < 3:
   interactive = 1
   fromfile = raw_input('File to be split? ')  # input if clicked 
   todir = raw_input('Directory to store part files? ')
  else:
   interactive = 0
   fromfile, todir = sys.argv[1:3]     # args in cmdline
   if len(sys.argv) == 4: chunksize = int(sys.argv[3])
  absfrom, absto = map(os.path.abspath, [fromfile, todir])
  print 'Splitting', absfrom, 'to', absto, 'by', chunksize
  try:
   parts = split(fromfile, todir, chunksize)
  except:
   print 'Error during split:'
   print sys.exc_info()[0], sys.exc_info()[1]
  else:
   print 'Split finished:', parts, 'parts are in', absto
  if interactive: raw_input('Press Enter key') # pause if clicked

合并文件join_file.py如下:

#!/usr/bin/python
##########################################################################
# join all part files in a dir created by split.py, to recreate file. 
# This is roughly like a 'cat fromdir/* > tofile' command on unix, but is 
# more portable and configurable, and exports the join operation as a 
# reusable function. Relies on sort order of file names: must be same 
# length. Could extend split/join to popup Tkinter file selectors.
##########################################################################
import os, sys
readsize = 1024
def join(fromdir, tofile):
 output = open(tofile, 'wb')
 parts = os.listdir(fromdir)
 parts.sort()
 for filename in parts:
  filepath = os.path.join(fromdir, filename)
  fileobj = open(filepath, 'rb')
  while 1:
   filebytes = fileobj.read(readsize)
   if not filebytes: break
   output.write(filebytes)
  fileobj.close()
 output.close()
if __name__ == '__main__':
 if len(sys.argv) == 2 and sys.argv[1] == '-help':
  print 'Use: join.py [from-dir-name to-file-name]'
 else:
  if len(sys.argv) != 3:
   interactive = 1
   fromdir = raw_input('Directory containing part files? ')
   tofile = raw_input('Name of file to be recreated? ')
  else:
   interactive = 0
   fromdir, tofile = sys.argv[1:]
  absfrom, absto = map(os.path.abspath, [fromdir, tofile])
  print 'Joining', absfrom, 'to make', absto
  try:
   join(fromdir, tofile)
  except:
   print 'Error joining files:'
   print sys.exc_info()[0], sys.exc_info()[1]
  else:
   print 'Join complete: see', absto
  if interactive: raw_input('Press Enter key') # pause if clicked

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
Python字符串替换实例分析
May 11 Python
Python实现信用卡系统(支持购物、转账、存取钱)
Jun 24 Python
Python 比较两个数组的元素的异同方法
Aug 17 Python
Python实现的朴素贝叶斯算法经典示例【测试可用】
Jun 13 Python
用Python编写一个高效的端口扫描器的方法
Dec 20 Python
Python函数中不定长参数的写法
Feb 13 Python
python实现kmp算法的实例代码
Apr 03 Python
python模拟菜刀反弹shell绕过限制【推荐】
Jun 25 Python
Python 实现自动完成A4标签排版打印功能
Apr 09 Python
在Keras中CNN联合LSTM进行分类实例
Jun 29 Python
使用keras实现非线性回归(两种加激活函数的方式)
Jul 05 Python
python 实现的IP 存活扫描脚本
Dec 10 Python
Python写入数据到MP3文件中的方法
Jul 10 #Python
Python将阿拉伯数字转换为罗马数字的方法
Jul 10 #Python
Python自动登录126邮箱的方法
Jul 10 #Python
Python获取邮件地址的方法
Jul 10 #Python
python实现中文分词FMM算法实例
Jul 10 #Python
Python实现的最近最少使用算法
Jul 10 #Python
Python导入oracle数据的方法
Jul 10 #Python
You might like
标准PHP的AES加密算法类
2015/03/12 PHP
php对xml文件的增删改查操作实现方法分析
2017/05/19 PHP
PHP 进程池与轮询调度算法实现多任务的示例代码
2019/11/26 PHP
ThinkPHP类似AOP思想的参数验证的实现方法
2019/12/18 PHP
基于js disabled=&quot;false&quot;不起作用的解决办法
2013/06/26 Javascript
input链接页面、打开新网页等等的具体实现
2013/12/30 Javascript
JS实现横向与竖向两个选项卡Tab联动的方法
2015/09/27 Javascript
jQuery+css实现炫目的动态块漂移效果
2016/01/28 Javascript
JS验证逗号隔开可以是中文字母数字
2016/04/22 Javascript
基于 Node.js 实现前后端分离
2016/04/23 Javascript
php main 与 iframe 相互通讯类(js+php同域/跨域)
2017/09/14 Javascript
JS逻辑运算符短路操作实例分析
2018/07/09 Javascript
Angular6 写一个简单的Select组件示例
2018/08/20 Javascript
详解如何使用webpack打包多页jquery项目
2019/02/01 jQuery
vue19 组建 Vue.extend component、组件模版、动态组件 的实例代码
2019/04/04 Javascript
jQuery实现判断滚动条滚动到document底部的方法分析
2019/08/27 jQuery
Vue动态加载图片在跨域时无法显示的问题及解决方法
2020/03/10 Javascript
Vuex的各个模块封装的实现
2020/06/05 Javascript
Python连接mssql数据库编码问题解决方法
2015/01/01 Python
详解 Python 与文件对象共事的实例
2017/09/11 Python
详解如何为eclipse安装合适版本的python插件pydev
2018/11/04 Python
python实现全排列代码(回溯、深度优先搜索)
2020/02/26 Python
Keras 利用sklearn的ROC-AUC建立评价函数详解
2020/06/15 Python
python中str内置函数用法总结
2020/12/27 Python
CSS3与动画有关的属性transition、animation、transform对比(史上最全版)
2017/08/18 HTML / CSS
详解基于 Canvas 手撸一个六边形能力图
2019/09/02 HTML / CSS
JMS中Topic和Queue有什么区别
2013/05/15 面试题
如何利用find命令查找文件
2016/11/18 面试题
大四自我鉴定范文
2013/10/06 职场文书
网上卖盒饭创业计划书范文
2014/02/07 职场文书
食堂采购员岗位职责
2014/03/17 职场文书
社区服务活动总结
2014/05/07 职场文书
2014年企业员工工作总结
2014/12/09 职场文书
《水上飞机》教学反思
2016/02/20 职场文书
2016年教师师德师风承诺书
2016/03/25 职场文书
Django展示可视化图表的多种方式
2021/04/08 Python