使用python进行拆分大文件的方法


Posted in Python onDecember 10, 2018

python按指定行数把大文件进行拆分

如图大文件有7000多万行,大小为16G

使用python进行拆分大文件的方法

需要拆分成多个200万行的小文件

代码如下:

# -*- coding:utf-8 -*-
from datetime import datetime
 
def Main():
 source_dir = '/data/u_lx_data/zhangqm/sh/yanjie/liuxuesheng/jz_yuanshi_list0206.txt'
 target_dir = '/data/u_lx_data/zhangqm/sh/yanjie/liuxuesheng/split/'
 
 # 计数器
 flag = 0
 
 # 文件名
 name = 1
 
 # 存放数据
 dataList = []
 
 print("开始。。。。。")
 print(datetime.now().strftime('%Y-%m-%d %H:%M:%S'))
 
 with open(source_dir,'r') as f_source:
  for line in f_source:
   flag+=1
   dataList.append(line)
   if flag == 2000000:
    with open(target_dir+"jz_yuanshi_list_"+str(name)+".txt",'w+') as f_target:
     for data in dataList:
      f_target.write(data)
    name+=1
    flag = 0
    dataList = []
    
 # 处理最后一批行数少于200万行的
 with open(target_dir+"jz_yuanshi_list_"+str(name)+".txt",'w+') as f_target:
  for data in dataList:
   f_target.write(data)
 
 print("完成。。。。。")
 print(datetime.now().strftime('%Y-%m-%d %H:%M:%S'))
 
if __name__ == "__main__":
 Main()

结果如下:

使用python进行拆分大文件的方法

总共产生39个文件,最后一个文件行数760821,这样就OK啦

经测试16G文件所需时间如图:不到两分钟

使用python进行拆分大文件的方法

以上这篇使用python进行拆分大文件的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python实现二分法算法实例
Feb 02 Python
Python的Flask框架中实现简单的登录功能的教程
Apr 20 Python
python基础之入门必看操作
Jul 26 Python
python 利用文件锁单例执行脚本的方法
Feb 19 Python
python 求1-100之间的奇数或者偶数之和的实例
Jun 11 Python
python暴力解压rar加密文件过程详解
Jul 05 Python
python实现kNN算法识别手写体数字的示例代码
Aug 16 Python
深入了解python中元类的相关知识
Aug 29 Python
简单了解python中的与或非运算
Sep 18 Python
python3中numpy函数tile的用法详解
Dec 04 Python
python selenium实现发送带附件的邮件代码实例
Dec 10 Python
Pandas读取csv时如何设置列名
Jun 02 Python
python使用udp实现聊天器功能
Dec 10 #Python
Python面向对象之类和对象实例详解
Dec 10 #Python
详解Django-auth-ldap 配置方法
Dec 10 #Python
Python网页正文转换语音文件的操作方法
Dec 09 #Python
python 使用 requests 模块发送http请求 的方法
Dec 09 #Python
Python实现八皇后问题示例代码
Dec 09 #Python
python中的tcp示例详解
Dec 09 #Python
You might like
php 广告调用类代码(支持Flash调用)
2011/08/11 PHP
关于php几种字符串连接的效率比较(详解)
2017/02/22 PHP
Laravel 集成 Geetest验证码的方法
2018/05/14 PHP
js 连接数据库如何操作数据库中的数据
2012/11/23 Javascript
js 距离某一时间点时间是多少实现代码
2013/10/14 Javascript
js单例模式详解实例
2013/11/21 Javascript
js键盘事件的keyCode
2014/07/29 Javascript
在Node.js中使用Javascript Generators详解
2016/05/05 Javascript
js 打开新页面在屏幕中间的实现方法
2016/11/02 Javascript
Bootstrap警告(Alerts)的实现方法
2017/03/22 Javascript
Bootstrap滚动监听组件scrollspy.js使用方法详解
2017/07/20 Javascript
通过button将form表单的数据提交到action层的实例
2017/09/08 Javascript
浅谈函数调用的不同方式,以及this的指向
2017/09/17 Javascript
五步轻松实现JavaScript HTML时钟效果
2020/03/25 Javascript
原生JS写Ajax的请求函数功能
2017/12/22 Javascript
在vue2.0中引用element-ui组件库的方法
2018/06/21 Javascript
微信小程序使用wxParse解析html的方法教程
2018/07/06 Javascript
小程序清理本地缓存的方法
2018/08/17 Javascript
JS学习笔记之闭包小案例分析
2019/05/29 Javascript
简单了解vue 插值表达式Mustache
2020/07/22 Javascript
JS实现购物车基本功能
2020/11/08 Javascript
python教程之用py2exe将PY文件转成EXE文件
2014/06/12 Python
Python标准库之多进程(multiprocessing包)介绍
2014/11/25 Python
在Linux下调试Python代码的各种方法
2015/04/17 Python
python:socket传输大文件示例
2017/01/18 Python
详谈python在windows中的文件路径问题
2018/04/28 Python
python函数参数(必须参数、可变参数、关键字参数)
2019/08/16 Python
关于python pycharm中输出的内容不全的解决办法
2020/01/10 Python
详解canvas绘制网络字体几种方法
2019/08/27 HTML / CSS
香港时装购物网站:ZALORA香港
2017/04/23 全球购物
吨的认识教学反思
2014/04/27 职场文书
医院领导班子四风对照检查材料
2014/09/27 职场文书
2014小学教师年度考核工作总结
2014/12/03 职场文书
2015财务年终工作总结范文
2015/05/22 职场文书
ztree+ajax实现文件树下载功能
2021/05/18 Javascript
Python实现打乒乓小游戏
2021/09/25 Python