python实现递归查找某个路径下所有文件中的中文字符


Posted in Python onAugust 31, 2019

本文实例为大家分享了python实现递归查找某个路径下所有文件中的中文字符,供大家参考,具体内容如下

# -*- coding: utf-8 -*-
# @ description:
# @ author: 
# @ created: 2018/7/21
 
import re
import sys
import os
 
reload(sys)
sys.setdefaultencoding("utf8")
 
 
def translate(str):
  out = set()
  line = str.strip().decode('utf-8', 'ignore') # 处理前进行相关的处理,包括转换成Unicode等
  p2 = re.compile(ur'[^\u4e00-\u9fa5]') # 中文的编码范围是:\u4e00到\u9fa5
  zh = " ".join(p2.split(line)).strip()
  # zh = "\n".join(zh.split()) #dsds经过相关处理后得到中文的文本
  for s in zh.split():
    out.add(s) # 经过相关处理后得到中文的文本
  return out
 
def extract_file(path):
  result = set()
  try:
    f = open(path) # 打开文件
    lines = f.readlines()
    for line in lines:
      string = translate(line)
      if string:
        result.update(string)
  except Exception as e:
    pass
  return result
 
 
def extract(path):
  result = set()
  files = os.listdir(path)
  for file in files:
    if not file.startswith("."):
      if not os.path.isdir(path + "/" + file): # 判断是否是文件夹,不是文件夹才打开ssgsg判断是否是文件夹,不是文件夹才打开
        sub_file = extract_file(path + "/" + file)
        if sub_file:
          result.update(sub_file)
      else:
        print file
        child = extract(path + "/" + file)
        if child:
          result.update(child)
  return result
 
 
if __name__ == '__main__':
  path = "/Users/common"
  result = extract(path)
  res_file = open("result.txt", "w")
  for s in result:
    res_file.write(s + "\n")

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python抓取京东价格分析京东商品价格走势
Jan 09 Python
Python迭代和迭代器详解
Nov 10 Python
Python中序列的修改、散列与切片详解
Aug 27 Python
Python3实现发送QQ邮件功能(html)
Dec 15 Python
使用Flask集成bootstrap的方法
Jul 24 Python
python如何解析配置文件并应用到项目中
Jun 27 Python
python pandas时序处理相关功能详解
Jul 03 Python
TensorFlow实现保存训练模型为pd文件并恢复
Feb 06 Python
python 插入日期数据到Oracle实例
Mar 02 Python
浅谈Python3中print函数的换行
Aug 05 Python
解决Pytorch dataloader时报错每个tensor维度不一样的问题
May 28 Python
python实现简单的聊天小程序
Jul 07 Python
python+django+rest框架配置创建方法
Aug 31 #Python
Python实现Restful API的例子
Aug 31 #Python
python递归下载文件夹下所有文件
Aug 31 #Python
python或C++读取指定文件夹下的所有图片
Aug 31 #Python
解决Django删除migrations文件夹中的文件后出现的异常问题
Aug 31 #Python
Django项目后台不挂断运行的方法
Aug 31 #Python
python遍历文件目录、批量处理同类文件
Aug 31 #Python
You might like
深入Nginx + PHP 缓存详解
2013/07/11 PHP
PHPer 需要了解的 5 个 Composer 小技巧
2014/08/18 PHP
用jscript启动sqlserver
2007/06/21 Javascript
javascript 写类方式之七
2009/07/05 Javascript
在html页面上拖放移动标签
2010/01/08 Javascript
javascript 防止刷新,后退,关闭
2010/08/07 Javascript
浅谈javascript的Array.prototype.slice.call
2015/08/31 Javascript
js判断手机号运营商的方法
2015/10/23 Javascript
纯js实现悬浮按钮组件
2016/12/17 Javascript
原生Javascript插件开发实践
2017/01/18 Javascript
如何使用vuejs实现更好的Form validation?
2017/04/07 Javascript
使用JS动态显示文本
2017/09/09 Javascript
浅谈vue的第一个commit分析
2020/06/08 Javascript
[32:47]完美世界DOTA2联赛 GXR vs IO 第二场 11.07
2020/11/09 DOTA
[01:04:20]完美世界DOTA2联赛PWL S2 LBZS vs Forest 第一场 11.29
2020/12/02 DOTA
python自定义异常实例详解
2017/07/11 Python
python编写暴力破解zip文档程序的实例讲解
2018/04/24 Python
python中的decorator的作用详解
2018/07/26 Python
python numpy之np.random的随机数函数使用介绍
2019/10/06 Python
flask 实现上传图片并缩放作为头像的例子
2020/01/09 Python
Django xadmin安装及使用详解
2020/10/26 Python
Django数据库迁移常见使用方法
2020/11/12 Python
Speedo速比涛中国官方网站:全球领先泳装运动品牌
2018/04/24 全球购物
zooplus意大利:在线宠物商店
2019/08/07 全球购物
机电一体化专业应届生求职信
2013/11/27 职场文书
商务英语广告词大全
2014/03/18 职场文书
采购部长岗位职责
2014/06/13 职场文书
预备党员学习十八届三中全会精神思想汇报
2014/09/13 职场文书
大学生党员批评与自我批评
2014/09/28 职场文书
模范教师材料大全
2014/12/16 职场文书
2015年社区纪检工作总结
2015/04/21 职场文书
升学宴祝酒词
2015/08/11 职场文书
选调生挂职锻炼工作总结
2015/10/23 职场文书
准备去美国留学,那么大学申请文书应该怎么写?
2019/08/12 职场文书
创业计划书之青年旅馆
2019/09/23 职场文书
el-table-column 内容不自动换行的解决方法
2022/08/14 Vue.js