使用python进行拆分大文件的方法


Posted in Python onDecember 10, 2018

python按指定行数把大文件进行拆分

如图大文件有7000多万行,大小为16G

使用python进行拆分大文件的方法

需要拆分成多个200万行的小文件

代码如下:

# -*- coding:utf-8 -*-
from datetime import datetime
 
def Main():
 source_dir = '/data/u_lx_data/zhangqm/sh/yanjie/liuxuesheng/jz_yuanshi_list0206.txt'
 target_dir = '/data/u_lx_data/zhangqm/sh/yanjie/liuxuesheng/split/'
 
 # 计数器
 flag = 0
 
 # 文件名
 name = 1
 
 # 存放数据
 dataList = []
 
 print("开始。。。。。")
 print(datetime.now().strftime('%Y-%m-%d %H:%M:%S'))
 
 with open(source_dir,'r') as f_source:
  for line in f_source:
   flag+=1
   dataList.append(line)
   if flag == 2000000:
    with open(target_dir+"jz_yuanshi_list_"+str(name)+".txt",'w+') as f_target:
     for data in dataList:
      f_target.write(data)
    name+=1
    flag = 0
    dataList = []
    
 # 处理最后一批行数少于200万行的
 with open(target_dir+"jz_yuanshi_list_"+str(name)+".txt",'w+') as f_target:
  for data in dataList:
   f_target.write(data)
 
 print("完成。。。。。")
 print(datetime.now().strftime('%Y-%m-%d %H:%M:%S'))
 
if __name__ == "__main__":
 Main()

结果如下:

使用python进行拆分大文件的方法

总共产生39个文件,最后一个文件行数760821,这样就OK啦

经测试16G文件所需时间如图:不到两分钟

使用python进行拆分大文件的方法

以上这篇使用python进行拆分大文件的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python实现的数据结构与算法之基本搜索详解
Apr 22 Python
使用Python的urllib和urllib2模块制作爬虫的实例教程
Jan 20 Python
Python之日期与时间处理模块(date和datetime)
Feb 16 Python
Python使用迭代器捕获Generator返回值的方法
Apr 05 Python
python实现批量修改图片格式和尺寸
Jun 07 Python
python实现微信定时每天和女友发送消息
Apr 29 Python
python字符串Intern机制详解
Jul 01 Python
简单了解python 生成器 列表推导式 生成器表达式
Aug 22 Python
Python表达式的优先级详解
Feb 18 Python
运行Python编写的程序方法实例
Oct 21 Python
Python matplotlib 利用随机函数生成变化图形
Apr 26 Python
python index() 与 rindex() 方法的使用示例详解
Dec 24 Python
python使用udp实现聊天器功能
Dec 10 #Python
Python面向对象之类和对象实例详解
Dec 10 #Python
详解Django-auth-ldap 配置方法
Dec 10 #Python
Python网页正文转换语音文件的操作方法
Dec 09 #Python
python 使用 requests 模块发送http请求 的方法
Dec 09 #Python
Python实现八皇后问题示例代码
Dec 09 #Python
python中的tcp示例详解
Dec 09 #Python
You might like
ThinkPHP中的三大自动简介
2014/08/22 PHP
PHP SPL标准库中的常用函数介绍
2015/05/11 PHP
php基于Snoopy解析网页html的方法
2015/07/09 PHP
PHP处理bmp格式图片的方法分析
2017/07/04 PHP
PHP异步进程助手async-helper
2018/02/05 PHP
php ActiveMQ的安装与使用方法图文教程
2020/02/23 PHP
Extjs4.0设置Ext.data.Store传参的请求方式(默认为GET)
2013/04/02 Javascript
实测jquery data()如何存值
2013/08/18 Javascript
Jquery通过Ajax访问XML数据的小例子
2013/11/18 Javascript
js识别不同浏览器基于userAgent做判断
2014/07/29 Javascript
调试JavaScript中正则表达式中遇到的问题
2015/01/27 Javascript
Jquery效果大全之制作电脑健康体检得分特效附源码下载
2015/11/02 Javascript
Three.js学习之文字形状及自定义形状
2016/08/01 Javascript
nodeJs链接Mysql做增删改查的简单操作
2017/02/04 NodeJs
深入解析Vue 组件命名那些事
2017/07/18 Javascript
Angularjs的$http异步删除数据详解及实例
2017/07/27 Javascript
Vue精简版风格指南(推荐)
2018/01/30 Javascript
jQuery轮播图实例详解
2018/08/15 jQuery
Angular4 Select选择改变事件的方法
2018/10/09 Javascript
使用 vue 实现灭霸打响指英雄消失的效果附demo
2019/05/06 Javascript
Javascript三种字符串连接方式及性能比较
2019/05/28 Javascript
微信小程序实现比较功能的方法汇总(五种方法)
2020/03/07 Javascript
Ant design vue中的联动选择取消操作
2020/10/31 Javascript
Python连接mysql数据库的正确姿势
2016/02/03 Python
用matplotlib画等高线图详解
2017/12/14 Python
python 求1-100之间的奇数或者偶数之和的实例
2019/06/11 Python
python Pandas库基础分析之时间序列的处理详解
2019/07/13 Python
Django 权限认证(根据不同的用户,设置不同的显示和访问权限)
2019/07/24 Python
tensorflow -gpu安装方法(不用自己装cuda,cdnn)
2020/01/20 Python
css3+jq创作含苞待放的荷花
2014/02/20 HTML / CSS
英国在线汽车和面包车零件商店:Car Parts 4 Less
2018/08/15 全球购物
司机的工作范围及职责
2013/11/13 职场文书
洗煤厂厂长岗位职责
2014/01/03 职场文书
物流专业自荐信
2014/05/23 职场文书
技术股份合作协议书
2014/10/05 职场文书
详解python中[-1]、[:-1]、[::-1]、[n::-1]使用方法
2021/04/25 Python