使用python进行拆分大文件的方法


Posted in Python onDecember 10, 2018

python按指定行数把大文件进行拆分

如图大文件有7000多万行,大小为16G

使用python进行拆分大文件的方法

需要拆分成多个200万行的小文件

代码如下:

# -*- coding:utf-8 -*-
from datetime import datetime
 
def Main():
 source_dir = '/data/u_lx_data/zhangqm/sh/yanjie/liuxuesheng/jz_yuanshi_list0206.txt'
 target_dir = '/data/u_lx_data/zhangqm/sh/yanjie/liuxuesheng/split/'
 
 # 计数器
 flag = 0
 
 # 文件名
 name = 1
 
 # 存放数据
 dataList = []
 
 print("开始。。。。。")
 print(datetime.now().strftime('%Y-%m-%d %H:%M:%S'))
 
 with open(source_dir,'r') as f_source:
  for line in f_source:
   flag+=1
   dataList.append(line)
   if flag == 2000000:
    with open(target_dir+"jz_yuanshi_list_"+str(name)+".txt",'w+') as f_target:
     for data in dataList:
      f_target.write(data)
    name+=1
    flag = 0
    dataList = []
    
 # 处理最后一批行数少于200万行的
 with open(target_dir+"jz_yuanshi_list_"+str(name)+".txt",'w+') as f_target:
  for data in dataList:
   f_target.write(data)
 
 print("完成。。。。。")
 print(datetime.now().strftime('%Y-%m-%d %H:%M:%S'))
 
if __name__ == "__main__":
 Main()

结果如下:

使用python进行拆分大文件的方法

总共产生39个文件,最后一个文件行数760821,这样就OK啦

经测试16G文件所需时间如图:不到两分钟

使用python进行拆分大文件的方法

以上这篇使用python进行拆分大文件的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python实现网站文件的全备份和差异备份
Nov 30 Python
Python中线程编程之threading模块的使用详解
Jun 23 Python
Python中进程和线程的区别详解
Oct 29 Python
解决py2exe打包后,总是多显示一个DOS黑色窗口的问题
Jun 21 Python
详解Python3迁移接口变化采坑记
Oct 11 Python
Python图片的横坐标汉字实例
Dec 04 Python
利用python实现.dcm格式图像转为.jpg格式
Jan 13 Python
python 读取二进制 显示图片案例
Apr 24 Python
使用opencv中匹配点对的坐标提取方式
Jun 04 Python
Python基于template实现字符串替换
Nov 27 Python
python实现启动一个外部程序,并且不阻塞当前进程
Dec 05 Python
python中编写函数并调用的知识点总结
Jan 13 Python
python使用udp实现聊天器功能
Dec 10 #Python
Python面向对象之类和对象实例详解
Dec 10 #Python
详解Django-auth-ldap 配置方法
Dec 10 #Python
Python网页正文转换语音文件的操作方法
Dec 09 #Python
python 使用 requests 模块发送http请求 的方法
Dec 09 #Python
Python实现八皇后问题示例代码
Dec 09 #Python
python中的tcp示例详解
Dec 09 #Python
You might like
一个可以删除字符串中HTML标记的PHP函数
2006/10/09 PHP
php 文章调用类代码
2011/08/11 PHP
PHP输出数组中重名的元素的几种处理方法
2012/09/05 PHP
解析php中mysql_connect与mysql_pconncet的区别详解
2013/05/15 PHP
微信公众平台之快递查询功能用法实例
2015/04/14 PHP
在 Laravel 中 “规范” 的开发短信验证码发送功能
2017/10/26 PHP
PHP之多条件混合筛选功能的实现方法
2019/10/09 PHP
jquery $(document).ready() 与window.onload的区别
2009/12/28 Javascript
使用text方法获取Html元素文本信息示例
2014/09/01 Javascript
Javascript实现计算个人所得税
2015/05/10 Javascript
通过XMLHttpRequest和jQuery实现ajax的几种方式
2015/08/28 Javascript
JS实现状态栏跑马灯文字效果代码
2015/10/24 Javascript
JS与jQuery实现子窗口获取父窗口元素值的方法
2017/04/17 jQuery
vue前端框架—Mint UI详解(更适用于移动端)
2019/04/30 Javascript
javascript中可能用得到的全部的排序算法
2020/03/05 Javascript
python 通过xml获取测试节点和属性的实例
2018/03/31 Python
使用python存储网页上的图片实例
2018/05/22 Python
替换python字典中的key值方法
2018/07/06 Python
Python面向对象程序设计之私有属性及私有方法示例
2019/04/08 Python
Python连接Hadoop数据中遇到的各种坑(汇总)
2020/04/14 Python
keras中的backend.clip用法
2020/05/22 Python
医院实习接收函
2014/01/12 职场文书
元旦晚会邀请函
2014/01/27 职场文书
工厂会计员职责
2014/02/06 职场文书
小学毕业感言300字
2014/02/19 职场文书
2014学年自我鉴定
2014/02/23 职场文书
企业诚信承诺书
2014/05/23 职场文书
银行求职信怎么写
2014/05/26 职场文书
企业安全生产责任书范本
2014/07/28 职场文书
经济贸易系求职信
2014/08/04 职场文书
入党积极分子学习优秀共产党员先进事迹思想汇报
2014/09/13 职场文书
小学中队长竞选稿
2015/11/20 职场文书
2016党员学习作风建设心得体会
2016/01/21 职场文书
合理缓解职场压力,让你随时保持最佳状态!
2019/06/21 职场文书
CSS font-variation 可变字体的魅力(实例详解)
2022/03/03 HTML / CSS
SpringBoot2零基础到精通之数据与页面响应
2022/03/22 Java/Android