python实现递归查找某个路径下所有文件中的中文字符


Posted in Python onAugust 31, 2019

本文实例为大家分享了python实现递归查找某个路径下所有文件中的中文字符,供大家参考,具体内容如下

# -*- coding: utf-8 -*-
# @ description:
# @ author: 
# @ created: 2018/7/21
 
import re
import sys
import os
 
reload(sys)
sys.setdefaultencoding("utf8")
 
 
def translate(str):
  out = set()
  line = str.strip().decode('utf-8', 'ignore') # 处理前进行相关的处理,包括转换成Unicode等
  p2 = re.compile(ur'[^\u4e00-\u9fa5]') # 中文的编码范围是:\u4e00到\u9fa5
  zh = " ".join(p2.split(line)).strip()
  # zh = "\n".join(zh.split()) #dsds经过相关处理后得到中文的文本
  for s in zh.split():
    out.add(s) # 经过相关处理后得到中文的文本
  return out
 
def extract_file(path):
  result = set()
  try:
    f = open(path) # 打开文件
    lines = f.readlines()
    for line in lines:
      string = translate(line)
      if string:
        result.update(string)
  except Exception as e:
    pass
  return result
 
 
def extract(path):
  result = set()
  files = os.listdir(path)
  for file in files:
    if not file.startswith("."):
      if not os.path.isdir(path + "/" + file): # 判断是否是文件夹,不是文件夹才打开ssgsg判断是否是文件夹,不是文件夹才打开
        sub_file = extract_file(path + "/" + file)
        if sub_file:
          result.update(sub_file)
      else:
        print file
        child = extract(path + "/" + file)
        if child:
          result.update(child)
  return result
 
 
if __name__ == '__main__':
  path = "/Users/common"
  result = extract(path)
  res_file = open("result.txt", "w")
  for s in result:
    res_file.write(s + "\n")

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中logging模块的用法实例
Sep 29 Python
Python读取ini文件、操作mysql、发送邮件实例
Jan 01 Python
Python单元测试框架unittest使用方法讲解
Apr 13 Python
python 3.5下xadmin的使用及修复源码bug
May 10 Python
python将ansible配置转为json格式实例代码
May 15 Python
django请求返回不同的类型图片json,xml,html的实例
May 22 Python
Python通用循环的构造方法实例分析
Dec 19 Python
Django--权限Permissions的例子
Aug 28 Python
基于python的列表list和集合set操作
Nov 24 Python
基于python traceback实现异常的获取与处理
Dec 13 Python
python游戏开发的五个案例分享
Mar 09 Python
keras K.function获取某层的输出操作
Jun 29 Python
python+django+rest框架配置创建方法
Aug 31 #Python
Python实现Restful API的例子
Aug 31 #Python
python递归下载文件夹下所有文件
Aug 31 #Python
python或C++读取指定文件夹下的所有图片
Aug 31 #Python
解决Django删除migrations文件夹中的文件后出现的异常问题
Aug 31 #Python
Django项目后台不挂断运行的方法
Aug 31 #Python
python遍历文件目录、批量处理同类文件
Aug 31 #Python
You might like
索尼SONY ICF-7600A(W)电路分析
2021/03/01 无线电
MySql 按时间段查询数据方法(实例说明)
2008/11/02 PHP
PHP 日志缩略名的创建函数代码
2010/05/26 PHP
php调用mysql数据 dbclass类
2011/05/07 PHP
php 获取本地IP代码
2013/06/23 PHP
利用PHP函数计算中英文字符串长度的方法
2014/11/11 PHP
CI框架给视图添加动态数据
2014/12/01 PHP
PHP上传Excel文件导入数据到MySQL数据库示例
2016/10/25 PHP
PHP实现的策略模式简单示例
2017/08/25 PHP
PHP PDO和消息队列的个人理解与应用实例分析
2019/11/25 PHP
javascript 得到变量类型的函数
2010/05/19 Javascript
JQuery拖动表头边框线调整表格列宽效果代码
2014/09/10 Javascript
一个JavaScript递归实现反转数组字符串的实例
2014/10/14 Javascript
轻松创建nodejs服务器(5):事件处理程序
2014/12/18 NodeJs
javascript实现在线客服效果
2015/07/15 Javascript
JS+CSS实现大气清新的滑动菜单效果代码
2015/10/22 Javascript
获取JS中网页各种高宽与位置的方法总结
2016/07/27 Javascript
JS设计模式之惰性模式(二)
2017/09/29 Javascript
JS中用EL表达式获取上下文参数值的方法
2018/03/28 Javascript
基于Vue实现微前端的示例代码
2020/04/24 Javascript
JavaScript监听键盘事件代码实现
2020/06/03 Javascript
利用Psyco提升Python运行速度
2014/12/24 Python
对python 读取线的shp文件实例详解
2018/12/22 Python
Django对数据库进行添加与更新的例子
2019/07/12 Python
Python上下文管理器类和上下文管理器装饰器contextmanager用法实例分析
2019/11/07 Python
Python操作注册表详细步骤介绍
2020/02/05 Python
pytorch实现CNN卷积神经网络
2020/02/19 Python
JAVA招聘远程笔试题
2015/07/23 面试题
美术毕业生求职信
2014/02/25 职场文书
2014年感恩节活动策划方案
2014/10/06 职场文书
学生会个人总结范文
2015/02/15 职场文书
英语通知范文
2015/04/22 职场文书
2015年计算机教学工作总结
2015/07/22 职场文书
工作感想范文
2015/08/07 职场文书
MySQL 表空间碎片的概念及相关问题解决
2021/05/07 MySQL
教你如何使用Python开发一个钉钉群应答机器人
2021/06/21 Python