Python 读取某个目录下所有的文件实例


Posted in Python onJune 23, 2018

在处理数据的时候,因为没有及时的去重,所以需要重新对生成txt进行去重。

可是一个文件夹下有很多txt,总不可能一个一个去操作,这样效率太低了。这里我们需要用到 os 这个包

关键的代码

<span style="font-size:14px;"># coding=utf-8
#出现了中文乱码的问题,于是我无脑utf-8 。希望后期的学习可以能理解
import os
import os.path
import re
import sys
import codecs
reload(sys)
sys.setdefaultencoding('utf-8')

#这里放着你要操作的文件夹名称
path = 'E:\\get_key\\'

#把e:\get_key\目录下的文件名全部获取保存在files中
files = os.listdir(path.decode('utf-8'))

#用set可以很好的去重,在数据处理的时候经常会被使用到。这里做初始化
datas = set()

for file in files :
 #准确获取一个txt的位置,利用字符串的拼接
 txt_path = 'E:\\get_key\\'+file.decode('utf-8')
 #把结果保存了在contents中
 contents = codecs.open(txt_path.decode('utf-8'),'r',encoding='utf-8')
 
 #datas的数据清空 
 datas.clear()
 
 #把数据add到datas中,可以去重
 for content in contents:
  print(content.decode('utf-8'))
  datas.add(content.decode('utf-8'))

 #去重后新的文件保存的路径
 new_txt_path = 'E:\\get_key3\\' + file.decode('utf-8')
 unique_keywords = codecs.open(new_txt_path.decode('utf-8'), 'w', encoding='utf-8')

 #把datas里的数据输出到新生成的txt中
 for data in datas:
  unique_keywords.write(data+"\n")

 #释放资源
 unique_keywords.close()</span>

以上这篇Python 读取某个目录下所有的文件实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python实现的一只从百度开始不断搜索的小爬虫
Aug 13 Python
Android应用开发中Action bar编写的入门教程
Feb 26 Python
Python读取和处理文件后缀为.sqlite的数据文件(实例讲解)
Jun 27 Python
基于pip install django失败时的解决方法
Jun 12 Python
Python实现手写一个类似django的web框架示例
Jul 20 Python
Numpy 改变数组维度的几种方法小结
Aug 02 Python
PyCharm鼠标右键不显示Run unittest的解决方法
Nov 30 Python
在Python文件中指定Python解释器的方法
Feb 18 Python
Python matplotlib生成图片背景透明的示例代码
Aug 30 Python
简单的Python调度器Schedule详解
Aug 30 Python
Python多进程编程multiprocessing代码实例
Mar 12 Python
Django+Django-Celery+Celery的整合实战
Jan 20 Python
python保存数据到本地文件的方法
Jun 23 #Python
基于Python List的赋值方法
Jun 23 #Python
python统计多维数组的行数和列数实例
Jun 23 #Python
Python返回数组/List长度的实例
Jun 23 #Python
python 定义给定初值或长度的list方法
Jun 23 #Python
Python列表解析配合if else的方法
Jun 23 #Python
基于Python列表解析(列表推导式)
Jun 23 #Python
You might like
从零开始 教你如何搭建Discuz!4.1论坛
2006/07/07 PHP
PHP的一个基础知识 表单提交
2011/07/04 PHP
PHP重定向的3种方式
2013/03/07 PHP
PHP编写学校网站上新生注册登陆程序的实例分享
2016/03/21 PHP
php 类中的常量、静态属性、非静态属性的区别
2017/04/09 PHP
PHP 二维array转换json的实例讲解
2018/08/21 PHP
PHP结合Ffmpeg快速搭建流媒体服务的实践记录
2018/10/31 PHP
用js实现上传图片前的预览(TX的面试题)
2007/08/14 Javascript
JavaScript类和继承 constructor属性
2010/03/04 Javascript
JS实现同时搜索百度和必应的方法
2015/01/27 Javascript
扒一扒JavaScript 预解释
2015/01/28 Javascript
JS+CSS简单树形菜单实现方法
2015/09/12 Javascript
JS获取月份最后天数、最大天数与某日周数的方法
2015/12/08 Javascript
基于jQuery的网页影音播放器jPlayer的基本使用教程
2016/03/08 Javascript
jQuery给表格添加分页效果
2017/03/02 Javascript
xmlplus组件设计系列之分隔框(DividedBox)(8)
2017/05/02 Javascript
基于jQuery和CSS3实现APPLE TV海报视差效果
2017/06/16 jQuery
Vue响应式原理深入解析及注意事项
2017/12/11 Javascript
Vue路由钩子之afterEach beforeEach的区别详解
2018/07/15 Javascript
ajaxfileupload.js实现上传文件功能
2019/04/19 Javascript
vue动态加载SVG文件并修改节点数据的操作代码
2020/08/17 Javascript
微信小程序实现多张图片上传功能
2020/11/18 Javascript
Python中函数的返回值示例浅析
2019/08/28 Python
Python传递参数的多种方式(小结)
2019/09/18 Python
python网络爬虫 Scrapy中selenium用法详解
2019/09/28 Python
基于pytorch的lstm参数使用详解
2020/01/14 Python
Python图像处理库PIL的ImageFilter模块使用介绍
2020/02/26 Python
Python MOCK SERVER moco模拟接口测试过程解析
2020/04/13 Python
python爬虫今日热榜数据到txt文件的源码
2021/02/23 Python
澳大利亚在线时尚精品店:Hello Molly
2018/02/26 全球购物
假面舞会策划方案
2014/05/29 职场文书
公安民警正风肃纪剖析材料
2014/10/10 职场文书
党员检讨书
2014/10/13 职场文书
如何Tomcat中使用ipv6地址
2022/05/06 Servers
nginx之queue的具体使用
2022/06/28 Servers
MyBatis在注解上使用动态SQL方式(@select使用if)
2022/07/07 Java/Android