Python实现文本文件拆分写入到多个文本文件的方法


Posted in Python onApril 18, 2021

引言

将一个txt文本文件中的内容行拆分固定的行数,自动分批写入到多个文本文件。
比如:一个源txt文件有5100行数据,每1000行插入到一个txt文件,最后获得6个txt文件(5个文本文件有1000行数据,第6个文本文件有100行数据)。

步骤

1、先建立一个目录用于存放分割后的txt文件(这里的目录名为:dataText)
2、修改拆分的数目(这里是每5000行数据存入一个txt文件)
3、运行python文件,查看生成的txt文件

代码

open_diff = open('data.txt', 'r') # 源文本文件
diff_line = open_diff.readlines()

line_list = []
for line in diff_line:
    line_list.append(line)

count = len(line_list) # 文件行数
print('源文件数据行数:',count)
# 切分diff
diff_match_split = [line_list[i:i+5000] for i in range(0,len(line_list),5000)]# 每个文件的数据行数

# 将切分的写入多个txt中
for i,j in zip(range(0,int(count/5000+1)),range(0,int(count/5000+1))): # 写入txt,计算需要写入的文件数
    with open('./dataText/ImageData%d.txt'% j,'w+') as temp:
        for line in diff_match_split[i]:
            temp.write(line)
print('拆分后文件的个数:',i+1)

结果

Python实现文本文件拆分写入到多个文本文件的方法

Python实现文本文件拆分写入到多个文本文件的方法

应用:

将txt文件中的数据拆分成多个文本文件,可以解决由于文本文件数据过大而无法导入某些软件的问。

这里是将一个url文本文件(约15M)导入idm下载url中的内容,但由于文本文件过大,数据量过多,就拆分成多个文本文件分批次导入idm。

注意:
1、程序中的5000为写入每个文件的数据行数,最后一个文件的行数不足5000,也用一个文本文件存储。
2、根据需要,修改存储数据的行数(两个地方的5000都需要修改)。

到此这篇关于Python实现文本文件拆分写入到多个文本文件的方法的文章就介绍到这了,更多相关Python 文本文件拆分内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python getopt 参数处理小示例
Jun 09 Python
python学习笔记:字典的使用示例详解
Jun 13 Python
wxpython中Textctrl回车事件无效的解决方法
Jul 21 Python
Python 最大概率法进行汉语切分的方法
Dec 14 Python
Python实现的KMeans聚类算法实例分析
Dec 29 Python
在python中利用opencv简单做图片比对的方法
Jan 24 Python
Python turtle绘画象棋棋盘
Aug 21 Python
详解numpy矩阵的创建与数据类型
Oct 18 Python
Python搭建代理IP池实现接口设置与整体调度
Oct 27 Python
python简单实现9宫格图片实例
Sep 03 Python
python help函数实例用法
Dec 06 Python
python使用BeautifulSoup 解析HTML
Apr 24 Python
python批量更改目录名/文件名的方法
Apr 18 #Python
python解决12306登录验证码的实现
django注册用邮箱发送验证码的实现
Apr 18 #Python
Python控制台输出俄罗斯方块的方法实例
Apr 17 #Python
python3 实现mysql数据库连接池的示例代码
Python如何利用正则表达式爬取网页信息及图片
Apr 17 #Python
python中sys模块的介绍与实例
Apr 17 #Python
You might like
怎样使用php与jquery设置和读取cookies
2013/08/08 PHP
完美的2个php检测字符串是否是utf-8编码函数分享
2014/07/28 PHP
PHP 实现判断用户是否手机访问
2015/01/21 PHP
详解PHP归并排序的实现
2016/10/18 PHP
PHP实现数组转JSon和JSon转数组的方法示例
2018/06/14 PHP
自定义Laravel (monolog)日志位置,并增加请求ID的实现
2019/10/17 PHP
textarea的value是html文件源代码,存成html文件的代码
2007/04/20 Javascript
利用Ext Js生成动态树实例代码
2008/09/08 Javascript
JAVASCRIPT下判断IE与FF的比较简单的方式
2008/10/17 Javascript
jquery uaMatch源代码
2011/02/14 Javascript
Google Dart编程语法和基本类型学习教程
2013/11/27 Javascript
JavaScript保存并运算页面中数字类型变量的写法
2015/07/06 Javascript
JS+CSS实现大气的黑色首页导航菜单效果代码
2015/09/10 Javascript
js内置对象处理_打印学生成绩单的简单实现
2016/09/24 Javascript
利用React-router+Webpack快速构建react程序
2016/10/27 Javascript
AngularJS控制器之间的通信方式详解
2016/11/03 Javascript
Bootstrap基本插件学习笔记之按钮(21)
2016/12/08 Javascript
JS实现键值对遍历json数组功能示例
2018/05/30 Javascript
详解Vue的钩子函数(路由导航守卫、keep-alive、生命周期钩子)
2018/07/24 Javascript
基于JavaScript 实现拖放功能
2019/09/12 Javascript
JS继承定义与使用方法简单示例
2020/02/19 Javascript
Vue组件间数据传递的方式(3种)
2020/07/13 Javascript
python开发之函数定义实例分析
2015/11/12 Python
PYTHON 中使用 GLOBAL引发的一系列问题
2016/10/12 Python
python实现监控某个服务 服务崩溃即发送邮件报告
2018/06/21 Python
python使用turtle库绘制树
2018/06/25 Python
python脚本监控Tomcat服务器的方法
2018/07/06 Python
Python列表元素删除和remove()方法详解
2021/01/04 Python
Tom Dixon官网:英国照明及家具设计和制造公司
2019/03/01 全球购物
电厂厂长岗位职责
2014/01/02 职场文书
无私奉献演讲稿
2014/09/04 职场文书
小学红领巾广播稿(3篇)
2014/09/13 职场文书
2014年妇产科工作总结
2014/12/08 职场文书
认识实习感想
2015/08/10 职场文书
导游词之鲁迅祖居
2019/10/17 职场文书
如何解决php-fpm启动不了问题
2021/11/17 PHP