Python实现文本文件拆分写入到多个文本文件的方法


Posted in Python onApril 18, 2021

引言

将一个txt文本文件中的内容行拆分固定的行数,自动分批写入到多个文本文件。
比如:一个源txt文件有5100行数据,每1000行插入到一个txt文件,最后获得6个txt文件(5个文本文件有1000行数据,第6个文本文件有100行数据)。

步骤

1、先建立一个目录用于存放分割后的txt文件(这里的目录名为:dataText)
2、修改拆分的数目(这里是每5000行数据存入一个txt文件)
3、运行python文件,查看生成的txt文件

代码

open_diff = open('data.txt', 'r') # 源文本文件
diff_line = open_diff.readlines()

line_list = []
for line in diff_line:
    line_list.append(line)

count = len(line_list) # 文件行数
print('源文件数据行数:',count)
# 切分diff
diff_match_split = [line_list[i:i+5000] for i in range(0,len(line_list),5000)]# 每个文件的数据行数

# 将切分的写入多个txt中
for i,j in zip(range(0,int(count/5000+1)),range(0,int(count/5000+1))): # 写入txt,计算需要写入的文件数
    with open('./dataText/ImageData%d.txt'% j,'w+') as temp:
        for line in diff_match_split[i]:
            temp.write(line)
print('拆分后文件的个数:',i+1)

结果

Python实现文本文件拆分写入到多个文本文件的方法

Python实现文本文件拆分写入到多个文本文件的方法

应用:

将txt文件中的数据拆分成多个文本文件,可以解决由于文本文件数据过大而无法导入某些软件的问。

这里是将一个url文本文件(约15M)导入idm下载url中的内容,但由于文本文件过大,数据量过多,就拆分成多个文本文件分批次导入idm。

注意:
1、程序中的5000为写入每个文件的数据行数,最后一个文件的行数不足5000,也用一个文本文件存储。
2、根据需要,修改存储数据的行数(两个地方的5000都需要修改)。

到此这篇关于Python实现文本文件拆分写入到多个文本文件的方法的文章就介绍到这了,更多相关Python 文本文件拆分内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python抓取豆瓣图片并自动保存示例学习
Jan 10 Python
Python常用内置函数总结
Feb 08 Python
Python实现简单的多任务mysql转xml的方法
Feb 08 Python
利用Python3分析sitemap.xml并抓取导出全站链接详解
Jul 04 Python
Python实现一个Git日志统计分析的小工具
Dec 14 Python
更换Django默认的模板引擎为jinja2的实现方法
May 28 Python
Django框架封装外部函数示例
May 28 Python
Python编译为二进制so可执行文件实例
Dec 23 Python
Python实现病毒仿真器的方法示例(附demo)
Feb 19 Python
解决Python pip 自动更新升级失败的问题
Feb 21 Python
python GUI库图形界面开发之PyQt5 Qt Designer工具(Qt设计师)详细使用方法及Designer ui文件转py文件方法
Feb 26 Python
Pycharm如何运行.py文件的方法步骤
Mar 03 Python
python批量更改目录名/文件名的方法
Apr 18 #Python
python解决12306登录验证码的实现
django注册用邮箱发送验证码的实现
Apr 18 #Python
Python控制台输出俄罗斯方块的方法实例
Apr 17 #Python
python3 实现mysql数据库连接池的示例代码
Python如何利用正则表达式爬取网页信息及图片
Apr 17 #Python
python中sys模块的介绍与实例
Apr 17 #Python
You might like
《PHP编程最快明白》第八讲:php启发和小结
2010/11/01 PHP
php错误、异常处理机制(补充)
2012/05/07 PHP
PHP中CURL方法curl_setopt()函数的参数分享
2013/01/19 PHP
php一维二维数组键排序方法实例总结
2014/11/13 PHP
实现复选框全选/全不选切换
2006/12/23 Javascript
javascript String 的扩展方法集合
2008/06/01 Javascript
javascript 多种搜索引擎集成的页面实现代码
2010/01/02 Javascript
跟我学习javascript解决异步编程异常方案
2015/11/23 Javascript
JS简单实现String转Date的方法
2016/03/02 Javascript
BootStrap Tooltip插件源码解析
2016/12/27 Javascript
jQuery基于Ajax方式提交表单功能示例
2017/02/10 Javascript
利用jQuery解析获取JSON数据
2017/04/08 jQuery
Vue2.x中的Render函数详解
2017/05/30 Javascript
vue单页应用在页面刷新时保留状态数据的方法
2018/09/21 Javascript
微信小程序Echarts图表组件使用方法详解
2019/06/25 Javascript
es6中reduce的基本使用方法
2019/09/10 Javascript
layui点击数据表格添加或删除一行的例子
2019/09/12 Javascript
vue-router 路由传参用法实例分析
2020/03/06 Javascript
Python入门_浅谈数据结构的4种基本类型
2017/05/16 Python
Python字符串格式化的方法(两种)
2017/09/19 Python
python编程线性回归代码示例
2017/12/07 Python
Django使用中间件解决前后端同源策略问题
2019/09/02 Python
使用Python的datetime库处理时间(RPA流程)
2019/11/24 Python
用Python绘制漫步图实例讲解
2020/02/26 Python
python shell命令行中import多层目录下的模块操作
2020/03/09 Python
Python配置pip国内镜像源的实现
2020/08/20 Python
python利用pytesseract 实现本地识别图片文字
2020/12/14 Python
使用HTML5的表单验证的简单示例
2015/09/09 HTML / CSS
中国旅游网站:同程旅游
2016/09/11 全球购物
澳大利亚最早和最古老的巨型游戏专家:Yardgames
2020/02/20 全球购物
Linux内核产生并发的原因
2016/11/08 面试题
会计毕业生自荐信
2013/11/21 职场文书
公司会议策划方案
2014/05/17 职场文书
同学聚会通知短信
2015/04/20 职场文书
python中sqllite插入numpy数组到数据库的实现方法
2021/06/21 Python
python使用matplotlib绘制图片时x轴的刻度处理
2021/08/30 Python