Python 读取某个目录下所有的文件实例


Posted in Python onJune 23, 2018

在处理数据的时候,因为没有及时的去重,所以需要重新对生成txt进行去重。

可是一个文件夹下有很多txt,总不可能一个一个去操作,这样效率太低了。这里我们需要用到 os 这个包

关键的代码

<span style="font-size:14px;"># coding=utf-8
#出现了中文乱码的问题,于是我无脑utf-8 。希望后期的学习可以能理解
import os
import os.path
import re
import sys
import codecs
reload(sys)
sys.setdefaultencoding('utf-8')

#这里放着你要操作的文件夹名称
path = 'E:\\get_key\\'

#把e:\get_key\目录下的文件名全部获取保存在files中
files = os.listdir(path.decode('utf-8'))

#用set可以很好的去重,在数据处理的时候经常会被使用到。这里做初始化
datas = set()

for file in files :
 #准确获取一个txt的位置,利用字符串的拼接
 txt_path = 'E:\\get_key\\'+file.decode('utf-8')
 #把结果保存了在contents中
 contents = codecs.open(txt_path.decode('utf-8'),'r',encoding='utf-8')
 
 #datas的数据清空 
 datas.clear()
 
 #把数据add到datas中,可以去重
 for content in contents:
  print(content.decode('utf-8'))
  datas.add(content.decode('utf-8'))

 #去重后新的文件保存的路径
 new_txt_path = 'E:\\get_key3\\' + file.decode('utf-8')
 unique_keywords = codecs.open(new_txt_path.decode('utf-8'), 'w', encoding='utf-8')

 #把datas里的数据输出到新生成的txt中
 for data in datas:
  unique_keywords.write(data+"\n")

 #释放资源
 unique_keywords.close()</span>

以上这篇Python 读取某个目录下所有的文件实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python多线程编程中的join函数使用心得
Sep 02 Python
python使用any判断一个对象是否为空的方法
Nov 19 Python
详解python 发送邮件实例代码
Dec 22 Python
开源Web应用框架Django图文教程
Mar 09 Python
python 实现一个贴吧图片爬虫的示例
Oct 12 Python
pandas值替换方法
Jul 10 Python
python使用PyQt5的简单方法
Feb 27 Python
git查看、创建、删除、本地、远程分支方法详解
Feb 18 Python
Python基于Serializer实现字段验证及序列化
Nov 04 Python
python Scrapy框架原理解析
Jan 04 Python
Python爬虫设置Cookie解决网站拦截并爬取蚂蚁短租的问题
Feb 22 Python
Python编程根据字典列表相同键的值进行合并
Oct 05 Python
python保存数据到本地文件的方法
Jun 23 #Python
基于Python List的赋值方法
Jun 23 #Python
python统计多维数组的行数和列数实例
Jun 23 #Python
Python返回数组/List长度的实例
Jun 23 #Python
python 定义给定初值或长度的list方法
Jun 23 #Python
Python列表解析配合if else的方法
Jun 23 #Python
基于Python列表解析(列表推导式)
Jun 23 #Python
You might like
PHP中文URL编解码(urlencode()rawurlencode()
2010/07/03 PHP
Thinkphp将二维数组变为标签适用的一维数组方法总结
2014/10/30 PHP
浅谈php自定义错误日志
2015/02/13 PHP
thinkPHP中分页用法实例分析
2015/12/26 PHP
php实现图片上传时添加文字和图片水印技巧
2020/04/18 PHP
JavaScript 撑出页面文字换行
2009/06/15 Javascript
js 返回时间戳所对应的具体时间
2010/07/20 Javascript
JavaScript如何调试有哪些建议和技巧附五款有用的调试工具
2015/10/28 Javascript
javascript iframe跨域详解
2016/10/26 Javascript
easyui-combobox 实现简单的自动补全功能示例
2016/11/08 Javascript
JS中闭包的经典用法小结(2则示例)
2016/12/28 Javascript
详解react阻止无效重渲染的多种方式
2018/12/11 Javascript
vue.js中ref和$refs的使用及示例讲解
2019/08/14 Javascript
vue路由传参页面刷新参数丢失问题解决方案
2019/10/08 Javascript
Vue执行方法,方法获取data值,设置data值,方法传值操作
2020/08/05 Javascript
js调用网络摄像头的方法
2020/12/05 Javascript
python 回调函数和回调方法的实现分析
2016/03/23 Python
Python使用sftp实现上传和下载功能(实例代码)
2017/03/14 Python
pycharm创建一个python包方法图解
2019/04/10 Python
用python wxpy管理微信公众号并利用微信获取自己的开源数据
2019/07/30 Python
用python中的matplotlib绘制方程图像代码
2019/11/21 Python
pytorch查看通道数 维数 尺寸大小方式
2020/05/26 Python
ffmpeg+Python实现B站MP4格式音频与视频的合并示例代码
2020/10/21 Python
如何使用Python进行PDF图片识别OCR
2021/01/22 Python
Nanushka官网:匈牙利服装品牌
2019/08/14 全球购物
心得体会开头
2014/01/01 职场文书
竞选学生会演讲稿
2014/04/25 职场文书
班主任个人工作反思
2014/04/28 职场文书
校园绿化美化方案
2014/06/08 职场文书
爱国口号
2014/06/19 职场文书
离婚协议书范本样本
2014/08/19 职场文书
大学生学习计划书
2014/09/15 职场文书
导游词之安徽醉翁亭
2020/01/10 职场文书
Python OpenCV快速入门教程
2021/04/17 Python
react中props 的使用及进行限制的方法
2021/04/28 Javascript
Python自动化测试PO模型封装过程详解
2021/06/22 Python