python分批定量读取文件内容,输出到不同文件中的方法


Posted in Python onDecember 08, 2018

一、文件内容的分发

应用场景:分批读取共有358086行内容的txt文件,每取1000条输出到一个文件当中

# coding=utf-8
# 分批读取共有358086行内容的txt文件,每取1000条输出到一个文件当中

txt_path = "E:/torrenthandle.txt"
base_path="E:/torrent_distribution/"


def distribution( ):
 f = open(txt_path,"r") 
 lines = f.readlines()
 f2=open(base_path+"1.txt","w")
 content=""
 for i in range( 1,len(lines) ):
  if ( i%1000!=0 ):
   content+=lines[i-1]
  else:
   content+=lines[i-1]
   f2.write(content.strip('\n'))
   block_path=base_path+str(i)+".txt"
   f2=open(block_path,"w")
   content=""
 #最后的扫尾工作
 content+=lines[i] 
 f2.write(content.strip('\n')) 
 f2.close()
 f.close()

distribution( )

二、文件夹(目录)下的内容分发

应用场景:分批读取目录下的文件,每取1000条输出到一个新的目录当中

# coding: utf-8

import os
import shutil

sourcepath = "E:\\sample"
distribution_path = "E:\\sample\\distribution\\" 

if __name__ =='__main__':
 rs = unicode(sourcepath , "utf8")
 count = 1
 savepath = unicode(distribution_path+"1", "utf-8")
 if not os.path.exists(savepath):
  os.makedirs(savepath)
 for rt,dirs,files in os.walk(rs):
  for fname in files:
   if ( count%1000!=0 ):
    shutil.copy(rt + os.sep + fname,savepath) 
    #os.remove(rt + os.sep + fname)
   else:
    shutil.copy(rt + os.sep + fname,savepath) 
    #os.remove(rt + os.sep + fname)
    savepath = unicode(distribution_path+str(count), "utf-8")
    if not os.path.exists(savepath):
     os.makedirs(savepath)
   count+=1

以上这篇python分批定量读取文件内容,输出到不同文件中的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
使用Python3中的gettext模块翻译Python源码以支持多语言
Mar 31 Python
剖析Python的Tornado框架中session支持的实现代码
Aug 21 Python
基于Python实现对PDF文件的OCR识别
Aug 05 Python
Python快速排序算法实例分析
Nov 29 Python
基于Python实现用户管理系统
Feb 26 Python
使用GitHub和Python实现持续部署的方法
May 09 Python
Pycharm运行加载文本出现错误的解决方法
Jun 27 Python
Python将文字转成语音并读出来的实例详解
Jul 15 Python
用python写一个定时提醒程序的实现代码
Jul 22 Python
Django logging配置及使用详解
Jul 23 Python
Python requests及aiohttp速度对比代码实例
Jul 16 Python
Python pyecharts绘制条形图详解
Apr 02 Python
对python遍历文件夹中的所有jpg文件的实例详解
Dec 08 #Python
pandas求两个表格不相交的集合方法
Dec 08 #Python
对pytorch网络层结构的数组化详解
Dec 08 #Python
pytorch对可变长度序列的处理方法详解
Dec 08 #Python
pytorch 转换矩阵的维数位置方法
Dec 08 #Python
pytorch 调整某一维度数据顺序的方法
Dec 08 #Python
Python操作mongodb数据库的方法详解
Dec 08 #Python
You might like
php自定义函数实现二维数组按指定key排序的方法
2016/09/29 PHP
PHP编写daemon process 实例详解
2016/11/13 PHP
js tab 选项卡
2009/04/26 Javascript
关于jquery.validate1.9.0前台验证的使用介绍
2013/04/26 Javascript
利用javascript实现全部删或清空所选的操作
2014/05/27 Javascript
使用GruntJS构建Web程序之合并压缩篇
2014/06/06 Javascript
jquery实现textarea 高度自适应
2015/03/11 Javascript
js获取图片宽高的方法
2015/11/25 Javascript
JavaScript判断按钮被点击的方法
2015/12/13 Javascript
JS判断指定dom元素是否在屏幕内的方法实例
2017/01/23 Javascript
html中通过JS获取JSON数据并加载的方法
2017/11/30 Javascript
vue-cli 3.0 自定义vue.config.js文件,多页构建的方法
2018/09/19 Javascript
详解多页应用 Webpack4 配置优化与踩坑记录
2018/10/16 Javascript
nodejs 递归拷贝、读取目录下所有文件和目录
2019/07/18 NodeJs
ES6基础之数组和对象的拓展实例详解
2019/08/22 Javascript
JavaScript实现轮播图效果
2020/10/30 Javascript
Python使用三种方法实现PCA算法
2017/12/12 Python
python Spyder界面无法打开的解决方法
2018/04/27 Python
Python从使用线程到使用async/await的深入讲解
2018/09/16 Python
python字符串替换re.sub()方法解析
2019/09/18 Python
DJango的创建和使用详解(默认数据库sqlite3)
2019/11/18 Python
Python3 Tkinkter + SQLite实现登录和注册界面
2019/11/19 Python
python实现遍历文件夹图片并重命名
2020/03/23 Python
Expedia韩国官网:亚洲发展最快的在线旅游门户网站
2018/02/26 全球购物
精细化工应届生求职信
2013/11/17 职场文书
《燕子专列》教学反思
2014/02/21 职场文书
启动仪式策划方案
2014/06/14 职场文书
交通局领导班子群众路线教育实践活动对照检查材料思想汇报
2014/10/09 职场文书
员工工作及收入证明
2014/10/28 职场文书
积极心理学课程心得体会
2016/01/22 职场文书
2016年学校“3.12”植树节活动总结
2016/03/16 职场文书
公司财务制度:成本管理控制制度模板
2019/11/19 职场文书
使用nginx动态转换图片大小生成缩略图
2021/03/31 Servers
python基础入门之字典和集合
2021/06/13 Python
win11高清晰音频管理器在哪里?win11找不到高清晰音频管理器解决办法
2022/04/08 数码科技
安装harbor作为docker镜像仓库的问题
2022/06/14 Servers