python分批定量读取文件内容,输出到不同文件中的方法


Posted in Python onDecember 08, 2018

一、文件内容的分发

应用场景:分批读取共有358086行内容的txt文件,每取1000条输出到一个文件当中

# coding=utf-8
# 分批读取共有358086行内容的txt文件,每取1000条输出到一个文件当中

txt_path = "E:/torrenthandle.txt"
base_path="E:/torrent_distribution/"


def distribution( ):
 f = open(txt_path,"r") 
 lines = f.readlines()
 f2=open(base_path+"1.txt","w")
 content=""
 for i in range( 1,len(lines) ):
  if ( i%1000!=0 ):
   content+=lines[i-1]
  else:
   content+=lines[i-1]
   f2.write(content.strip('\n'))
   block_path=base_path+str(i)+".txt"
   f2=open(block_path,"w")
   content=""
 #最后的扫尾工作
 content+=lines[i] 
 f2.write(content.strip('\n')) 
 f2.close()
 f.close()

distribution( )

二、文件夹(目录)下的内容分发

应用场景:分批读取目录下的文件,每取1000条输出到一个新的目录当中

# coding: utf-8

import os
import shutil

sourcepath = "E:\\sample"
distribution_path = "E:\\sample\\distribution\\" 

if __name__ =='__main__':
 rs = unicode(sourcepath , "utf8")
 count = 1
 savepath = unicode(distribution_path+"1", "utf-8")
 if not os.path.exists(savepath):
  os.makedirs(savepath)
 for rt,dirs,files in os.walk(rs):
  for fname in files:
   if ( count%1000!=0 ):
    shutil.copy(rt + os.sep + fname,savepath) 
    #os.remove(rt + os.sep + fname)
   else:
    shutil.copy(rt + os.sep + fname,savepath) 
    #os.remove(rt + os.sep + fname)
    savepath = unicode(distribution_path+str(count), "utf-8")
    if not os.path.exists(savepath):
     os.makedirs(savepath)
   count+=1

以上这篇python分批定量读取文件内容,输出到不同文件中的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
使用python实现递归版汉诺塔示例(汉诺塔递归算法)
Apr 08 Python
Python中操作MySQL入门实例
Feb 08 Python
python中的json总结
Oct 11 Python
python实现根据指定字符截取对应的行的内容方法
Oct 23 Python
python 自定义对象的打印方法
Jan 12 Python
Django中多种重定向方法使用详解
Jul 17 Python
给我一面国旗 python帮你实现
Sep 30 Python
python3常用的数据清洗方法(小结)
Oct 31 Python
VScode连接远程服务器上的jupyter notebook的实现
Apr 23 Python
解决python虚拟环境切换无效的问题
Apr 30 Python
Python 利用flask搭建一个共享服务器的步骤
Dec 05 Python
python3实现无权最短路径的方法
May 12 Python
对python遍历文件夹中的所有jpg文件的实例详解
Dec 08 #Python
pandas求两个表格不相交的集合方法
Dec 08 #Python
对pytorch网络层结构的数组化详解
Dec 08 #Python
pytorch对可变长度序列的处理方法详解
Dec 08 #Python
pytorch 转换矩阵的维数位置方法
Dec 08 #Python
pytorch 调整某一维度数据顺序的方法
Dec 08 #Python
Python操作mongodb数据库的方法详解
Dec 08 #Python
You might like
PHP自定义函数收代码
2010/08/01 PHP
PHP输出英文时间日期的安全方法(RFC 1123格式)
2014/06/13 PHP
php微信支付之APP支付方法
2015/03/04 PHP
PHP和MYSQL实现分页导航思路详解
2017/04/11 PHP
使用PHPExcel实现数据批量导出为excel表格的方法(必看)
2017/06/09 PHP
Thinkphp极验滑动验证码实现步骤解析
2020/11/24 PHP
JavaScript语言中的Literal Syntax特性分析
2007/03/08 Javascript
javascript OFFICE控件测试代码
2009/12/08 Javascript
分享20个提升网站界面体验的jQuery插件
2014/12/15 Javascript
Js使用WScript.Shell对象执行.bat文件和cmd命令
2014/12/18 Javascript
jQuery+html5+css3实现圆角无刷新表单带输入验证功能代码
2015/08/21 Javascript
artDialog+plupload实现多文件上传
2016/07/19 Javascript
基于jQuery和CSS3实现APPLE TV海报视差效果
2017/06/16 jQuery
jQuery绑定事件方法及区别(bind,click,on,live,one)
2017/08/14 jQuery
vue单页缓存方案分析及实现
2018/09/25 Javascript
深入解析vue 源码目录及构建过程分析
2019/04/24 Javascript
[57:37]EG vs Mineski 2018国际邀请赛小组赛BO2 第二场 8.16
2018/08/17 DOTA
在Python中使用模块的教程
2015/04/27 Python
讲解Python中运算符使用时的优先级
2015/05/14 Python
Python实现读取TXT文件数据并存进内置数据库SQLite3的方法
2017/08/08 Python
浅谈python数据类型及类型转换
2017/12/18 Python
[原创]Python入门教程2. 字符串基本操作【运算、格式化输出、常用函数】
2018/10/29 Python
python 读取文件并把矩阵转成numpy的两种方法
2019/02/12 Python
python动态进度条的实现代码
2019/07/03 Python
Python计算两个矩形重合面积代码实例
2019/09/16 Python
tensorflow自定义激活函数实例
2020/02/04 Python
Python3 filecmp模块测试比较文件原理解析
2020/03/23 Python
pandas DataFrame 数据选取,修改,切片的实现
2020/04/24 Python
Python2及Python3如何实现兼容切换
2020/09/01 Python
Python创建简单的神经网络实例讲解
2021/01/04 Python
Nordgreen手表德国官方网站:丹麦极简主义手表
2019/10/31 全球购物
委托书格式
2014/08/01 职场文书
就业协议书怎么填
2014/09/15 职场文书
2014年综治维稳工作总结
2014/11/17 职场文书
Python办公自动化解决world文件批量转换
2021/09/15 Python
mysql5.6主从搭建以及不同步问题详解
2021/12/04 MySQL