python分批定量读取文件内容,输出到不同文件中的方法


Posted in Python onDecember 08, 2018

一、文件内容的分发

应用场景:分批读取共有358086行内容的txt文件,每取1000条输出到一个文件当中

# coding=utf-8
# 分批读取共有358086行内容的txt文件,每取1000条输出到一个文件当中

txt_path = "E:/torrenthandle.txt"
base_path="E:/torrent_distribution/"


def distribution( ):
 f = open(txt_path,"r") 
 lines = f.readlines()
 f2=open(base_path+"1.txt","w")
 content=""
 for i in range( 1,len(lines) ):
  if ( i%1000!=0 ):
   content+=lines[i-1]
  else:
   content+=lines[i-1]
   f2.write(content.strip('\n'))
   block_path=base_path+str(i)+".txt"
   f2=open(block_path,"w")
   content=""
 #最后的扫尾工作
 content+=lines[i] 
 f2.write(content.strip('\n')) 
 f2.close()
 f.close()

distribution( )

二、文件夹(目录)下的内容分发

应用场景:分批读取目录下的文件,每取1000条输出到一个新的目录当中

# coding: utf-8

import os
import shutil

sourcepath = "E:\\sample"
distribution_path = "E:\\sample\\distribution\\" 

if __name__ =='__main__':
 rs = unicode(sourcepath , "utf8")
 count = 1
 savepath = unicode(distribution_path+"1", "utf-8")
 if not os.path.exists(savepath):
  os.makedirs(savepath)
 for rt,dirs,files in os.walk(rs):
  for fname in files:
   if ( count%1000!=0 ):
    shutil.copy(rt + os.sep + fname,savepath) 
    #os.remove(rt + os.sep + fname)
   else:
    shutil.copy(rt + os.sep + fname,savepath) 
    #os.remove(rt + os.sep + fname)
    savepath = unicode(distribution_path+str(count), "utf-8")
    if not os.path.exists(savepath):
     os.makedirs(savepath)
   count+=1

以上这篇python分批定量读取文件内容,输出到不同文件中的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中for循环详解
Jan 17 Python
python实现批量转换文件编码(批转换编码示例)
Jan 23 Python
python使用rpc框架gRPC的方法
Aug 24 Python
python3 实现对图片进行局部切割的方法
Dec 05 Python
Python3从零开始搭建一个语音对话机器人的实现
Aug 23 Python
Python3进制之间的转换代码实例
Aug 24 Python
python SocketServer源码深入解读
Sep 17 Python
Python内置数据类型list各方法的性能测试过程解析
Jan 07 Python
TensorFlow实现保存训练模型为pd文件并恢复
Feb 06 Python
浅谈Python中的模块
Jun 10 Python
Pycharm Available Package无法显示/安装包的问题Error Loading Package List解决
Sep 18 Python
python实现三种随机请求头方式
Jan 05 Python
对python遍历文件夹中的所有jpg文件的实例详解
Dec 08 #Python
pandas求两个表格不相交的集合方法
Dec 08 #Python
对pytorch网络层结构的数组化详解
Dec 08 #Python
pytorch对可变长度序列的处理方法详解
Dec 08 #Python
pytorch 转换矩阵的维数位置方法
Dec 08 #Python
pytorch 调整某一维度数据顺序的方法
Dec 08 #Python
Python操作mongodb数据库的方法详解
Dec 08 #Python
You might like
Yii查询生成器(Query Builder)用法实例教程
2014/09/04 PHP
详解在YII2框架中使用UEditor编辑器发布文章
2018/11/02 PHP
PHP进阶学习之依赖注入与Ioc容器详解
2019/06/19 PHP
PHP 99乘法表的几种实现代码
2020/10/13 PHP
Nigma vs AM BO3 第二场2.13
2021/03/10 DOTA
nicejforms——美化表单不用愁
2007/02/20 Javascript
formStorage 基于jquery的一个插件(存储表单中元素的状态到本地)
2012/01/20 Javascript
javascript阻止scroll事件多次执行的思路及实现
2013/11/08 Javascript
jQuery中offsetParent()方法用法实例
2015/01/19 Javascript
新手快速学习JavaScript免费教程资源汇总
2015/06/25 Javascript
使用jQuery判断浏览器滚动条位置的方法
2016/05/30 Javascript
Vue.js render方法使用详解
2017/04/05 Javascript
基于nodejs 的多页面爬虫实例代码
2017/05/31 NodeJs
H5实现仿flash效果的实现代码
2017/09/29 Javascript
VUE搭建手机商城心得和遇到的坑
2019/02/21 Javascript
js+canvas实现五子棋小游戏
2020/08/02 Javascript
Python正则表达式匹配HTML页面编码
2015/04/08 Python
Python编程中的异常处理教程
2015/08/21 Python
简单实现python收发邮件功能
2018/01/05 Python
Python和Java进行DES加密和解密的实例
2018/01/09 Python
python微信公众号开发简单流程
2018/03/23 Python
django中ORM模型常用的字段的使用方法
2019/03/05 Python
Python在Matplotlib图中显示中文字体的操作方法
2019/07/29 Python
Python3.9最新版下载与安装图文教程详解(Windows系统为例)
2020/11/28 Python
python爬虫scrapy框架之增量式爬虫的示例代码
2021/02/26 Python
丝芙兰墨西哥官网:Sephora墨西哥
2020/05/30 全球购物
网络研修随笔感言
2014/02/17 职场文书
安卓程序员求职信
2014/02/28 职场文书
优秀护士先进事迹
2014/05/08 职场文书
2014年工商所工作总结
2014/12/09 职场文书
出纳岗位职责范本
2015/03/31 职场文书
2015年干部教育培训工作总结
2015/05/15 职场文书
2016北大自主招生自荐信模板
2016/01/28 职场文书
《藏戏》教学反思
2016/02/23 职场文书
Mysql外键约束的创建与删除的使用
2022/03/03 MySQL
Apache SeaTunnel实现 非CDC数据抽取
2022/05/20 Servers