Python 读取某个目录下所有的文件实例


Posted in Python onJune 23, 2018

在处理数据的时候,因为没有及时的去重,所以需要重新对生成txt进行去重。

可是一个文件夹下有很多txt,总不可能一个一个去操作,这样效率太低了。这里我们需要用到 os 这个包

关键的代码

<span style="font-size:14px;"># coding=utf-8
#出现了中文乱码的问题,于是我无脑utf-8 。希望后期的学习可以能理解
import os
import os.path
import re
import sys
import codecs
reload(sys)
sys.setdefaultencoding('utf-8')

#这里放着你要操作的文件夹名称
path = 'E:\\get_key\\'

#把e:\get_key\目录下的文件名全部获取保存在files中
files = os.listdir(path.decode('utf-8'))

#用set可以很好的去重,在数据处理的时候经常会被使用到。这里做初始化
datas = set()

for file in files :
 #准确获取一个txt的位置,利用字符串的拼接
 txt_path = 'E:\\get_key\\'+file.decode('utf-8')
 #把结果保存了在contents中
 contents = codecs.open(txt_path.decode('utf-8'),'r',encoding='utf-8')
 
 #datas的数据清空 
 datas.clear()
 
 #把数据add到datas中,可以去重
 for content in contents:
  print(content.decode('utf-8'))
  datas.add(content.decode('utf-8'))

 #去重后新的文件保存的路径
 new_txt_path = 'E:\\get_key3\\' + file.decode('utf-8')
 unique_keywords = codecs.open(new_txt_path.decode('utf-8'), 'w', encoding='utf-8')

 #把datas里的数据输出到新生成的txt中
 for data in datas:
  unique_keywords.write(data+"\n")

 #释放资源
 unique_keywords.close()</span>

以上这篇Python 读取某个目录下所有的文件实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python实现检测服务器是否可以ping通的2种方法
Jan 01 Python
在Python中操作时间之strptime()方法的使用
Dec 30 Python
Python的Django框架中forms表单类的使用方法详解
Jun 21 Python
详解Python进程间通信之命名管道
Aug 28 Python
python3 读写文件换行符的方法
Apr 09 Python
Python中的单行、多行、中文注释方法
Jul 19 Python
PyCharm+Qt Designer+PyUIC安装配置教程详解
Jun 13 Python
Flask框架实现的前端RSA加密与后端Python解密功能详解
Aug 13 Python
Python读取excel文件中带公式的值的实现
Apr 17 Python
Keras自定义实现带masking的meanpooling层方式
Jun 16 Python
最新PyCharm 2020.2.3永久激活码(亲测有效)
Nov 26 Python
Python 读取千万级数据自动写入 MySQL 数据库
Jun 28 Python
python保存数据到本地文件的方法
Jun 23 #Python
基于Python List的赋值方法
Jun 23 #Python
python统计多维数组的行数和列数实例
Jun 23 #Python
Python返回数组/List长度的实例
Jun 23 #Python
python 定义给定初值或长度的list方法
Jun 23 #Python
Python列表解析配合if else的方法
Jun 23 #Python
基于Python列表解析(列表推导式)
Jun 23 #Python
You might like
main.php
2006/12/09 PHP
PHP 函数语法介绍一
2009/06/14 PHP
mysqli_set_charset和SET NAMES使用抉择及优劣分析
2013/01/13 PHP
微信公众号判断用户是否已关注php代码解析
2016/06/24 PHP
jquery ajax 检测用户注册时用户名是否存在
2009/11/03 Javascript
ExtJS 设置级联菜单的默认值
2010/06/13 Javascript
jquery使用$(element).is()来判断获取的tagName
2014/08/24 Javascript
老生常谈 js中this的指向
2016/06/30 Javascript
轮播图组件js代码
2016/08/08 Javascript
浅谈JS继承_借用构造函数 &amp; 组合式继承
2016/08/16 Javascript
jQuery使用deferreds串行多个ajax请求
2016/08/22 Javascript
使用jQuery监听扫码枪输入并禁止手动输入的实现方法(推荐)
2017/03/21 jQuery
iOS + node.js使用Socket.IO框架进行实时通信示例
2017/04/14 Javascript
微信小程序 动画的简单实例
2017/10/12 Javascript
在vue中使用公共过滤器filter的方法
2018/06/26 Javascript
socket io与vue-cli的结合使用的示例代码
2018/11/01 Javascript
微信小程序实现左右列表联动
2020/05/19 Javascript
vue框架制作购物车小球动画效果实例代码
2019/09/26 Javascript
Vue为什么要谨慎使用$attrs与$listeners
2020/08/27 Javascript
分享8个JavaScript库可更好地处理本地存储
2020/10/12 Javascript
Python Deque 模块使用详解
2014/07/04 Python
常见的在Python中实现单例模式的三种方法
2015/04/08 Python
解决Python字典写入文件出行首行有空格的问题
2017/09/27 Python
Pycharm新建模板默认添加个人信息的实例
2019/07/15 Python
在pycharm中配置Anaconda以及pip源配置详解
2019/09/09 Python
Python循环实现n的全排列功能
2019/09/16 Python
基于python实现把图片转换成素描
2019/11/13 Python
Herschel美国官网:背包、手提袋及配件
2020/03/10 全球购物
三万活动总结
2014/04/28 职场文书
法人任命书范本
2014/06/04 职场文书
二人合伙经营协议书
2014/09/13 职场文书
平遥古城导游词
2015/02/03 职场文书
女人创业励志语录,句句蕴含能量,激发你的潜能
2019/08/20 职场文书
2019年励志签名:致拼搏路上的自己
2019/10/11 职场文书
Java实现房屋出租系统详解
2021/10/05 Java/Android
Go结合Gin导出Mysql数据到Excel表格
2022/08/05 Golang