Python 读取某个目录下所有的文件实例


Posted in Python onJune 23, 2018

在处理数据的时候,因为没有及时的去重,所以需要重新对生成txt进行去重。

可是一个文件夹下有很多txt,总不可能一个一个去操作,这样效率太低了。这里我们需要用到 os 这个包

关键的代码

<span style="font-size:14px;"># coding=utf-8
#出现了中文乱码的问题,于是我无脑utf-8 。希望后期的学习可以能理解
import os
import os.path
import re
import sys
import codecs
reload(sys)
sys.setdefaultencoding('utf-8')

#这里放着你要操作的文件夹名称
path = 'E:\\get_key\\'

#把e:\get_key\目录下的文件名全部获取保存在files中
files = os.listdir(path.decode('utf-8'))

#用set可以很好的去重,在数据处理的时候经常会被使用到。这里做初始化
datas = set()

for file in files :
 #准确获取一个txt的位置,利用字符串的拼接
 txt_path = 'E:\\get_key\\'+file.decode('utf-8')
 #把结果保存了在contents中
 contents = codecs.open(txt_path.decode('utf-8'),'r',encoding='utf-8')
 
 #datas的数据清空 
 datas.clear()
 
 #把数据add到datas中,可以去重
 for content in contents:
  print(content.decode('utf-8'))
  datas.add(content.decode('utf-8'))

 #去重后新的文件保存的路径
 new_txt_path = 'E:\\get_key3\\' + file.decode('utf-8')
 unique_keywords = codecs.open(new_txt_path.decode('utf-8'), 'w', encoding='utf-8')

 #把datas里的数据输出到新生成的txt中
 for data in datas:
  unique_keywords.write(data+"\n")

 #释放资源
 unique_keywords.close()</span>

以上这篇Python 读取某个目录下所有的文件实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python实现mysql的单引号字符串过滤方法
Nov 14 Python
深入理解python中的闭包和装饰器
Jun 12 Python
Python使用回溯法子集树模板解决爬楼梯问题示例
Sep 08 Python
python list元素为tuple时的排序方法
Apr 18 Python
Python中的Django基本命令实例详解
Jul 15 Python
对python的unittest架构公共参数token提取方法详解
Dec 17 Python
python通过http下载文件的方法详解
Jul 26 Python
python selenium循环登陆网站的实现
Nov 04 Python
python二分法查找算法实现方法【递归与非递归】
Dec 06 Python
Python3和PyCharm安装与环境配置【图文教程】
Feb 14 Python
基于Python+QT的gui程序开发实现
Jul 03 Python
python实现Nao机器人的单目测距
Sep 04 Python
python保存数据到本地文件的方法
Jun 23 #Python
基于Python List的赋值方法
Jun 23 #Python
python统计多维数组的行数和列数实例
Jun 23 #Python
Python返回数组/List长度的实例
Jun 23 #Python
python 定义给定初值或长度的list方法
Jun 23 #Python
Python列表解析配合if else的方法
Jun 23 #Python
基于Python列表解析(列表推导式)
Jun 23 #Python
You might like
基于mysql的bbs设计(二)
2006/10/09 PHP
非常好的php目录导航文件代码
2006/10/09 PHP
FCKeditor的安装(PHP)
2007/01/13 PHP
PHP学习之数组的定义和填充
2011/04/17 PHP
PHP序列号生成函数和字符串替换函数代码
2012/06/07 PHP
让CodeIgniter数据库缓存自动过期的处理的方法
2014/06/12 PHP
Mac下php 5升级到php 7的步骤详解
2017/04/26 PHP
TP5框架实现签到功能的方法分析
2020/04/05 PHP
jquery 注意事项与常用语法小结
2010/06/07 Javascript
关于全局变量和局部变量的那些事
2013/01/11 Javascript
使用jquery.upload.js实现异步上传示例代码
2014/07/29 Javascript
返回顶部按钮响应滚动且动态显示与隐藏
2014/10/14 Javascript
JavaScript代码生成PDF文件的方法
2016/02/26 Javascript
动态生成的DOM不会触发onclick事件的原因及解决方法
2016/08/06 Javascript
浅析Javascript的自动分号插入(ASI)机制
2016/09/29 Javascript
JS实现仿百度文库评分功能
2017/01/12 Javascript
[47:03]完美世界DOTA2联赛PWL S3 Galaxy Racer vs Phoenix 第二场 12.10
2020/12/13 DOTA
Python实现的几个常用排序算法实例
2014/06/16 Python
利用Python找出序列中出现最多的元素示例代码
2017/12/08 Python
python逆向入门教程
2018/01/15 Python
pyqt5简介及安装方法介绍
2018/01/31 Python
详解PyTorch中Tensor的高阶操作
2019/08/18 Python
TensorFlow 输出checkpoint 中的变量名与变量值方式
2020/02/11 Python
Python + selenium + crontab实现每日定时自动打卡功能
2020/03/31 Python
Jupyter Notebook添加代码自动补全功能的实现
2021/01/07 Python
HTML5 canvas基本绘图之文字渲染
2016/06/27 HTML / CSS
韩国家庭购物网上商店:Nsmall
2017/05/07 全球购物
应届生求职推荐信
2013/10/28 职场文书
师范应届生语文教师求职信
2013/10/29 职场文书
幼儿园毕业典礼主持词
2014/03/21 职场文书
党支部班子“四风”问题自我剖析材料
2014/09/28 职场文书
先进班集体事迹材料
2014/12/25 职场文书
志愿者事迹材料
2014/12/26 职场文书
同学聚会通知书
2015/04/20 职场文书
2015年小学远程教育工作总结
2015/07/28 职场文书
Java多条件判断场景中规则执行器的设计
2021/06/26 Java/Android