Python查找文件中包含中文的行方法


Posted in Python onDecember 19, 2018

前言

近几天在做多语言版本的时候再次发现,区分各种语言真的是一件比较困难的事情,上一次做中文提取工具的就花了不少时间,这次决定用python试一试,结果写起来发现真是方便不少,自己整理了一下方便以后查找使用。

代码

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
# find the line of containing chinese in files

__author__ = 'AlbertS'

import re

def start_find_chinese():
 find_count = 0;
 with open('ko_untranslated.txt', 'wb') as outfile:
  with open('source_ko.txt', 'rb') as infile:
   while True:
    content = infile.readline()
    if re.match(r'(.*[\u4E00-\u9FA5]+)|([\u4E00-\u9FA5]+.*)', content.decode('utf-8')):
     outfile.write(content)
     find_count += 1;

    if not content:
     return find_count

# start to find
if __name__ == '__main__':
 count = start_find_chinese()
 print("find complete! count =", count)

原始文件

source_ko.txt文件内容

3 캐릭터 Lv.50 달성
8 캐릭터 Lv.80 달성
10 캐릭터 Lv.90 달성
...
...
2840 飞黄腾达
4841 同归于尽
8848 캐릭터 Lv.50 달

运行效果(ko_untranslated.txt文件)

2840 飞黄腾达
4841 同归于尽

总结

1. 其实这段小小的代码中包含了两个常用的功能,那就是读写文件和正则表达式。

2. 这也是两个重要的知识点,其中with操作可能防止资源泄漏,操作起来更加方便。

3. 正则表达式可是一个文字处理的利器,代码中的正则可能还不太完善,后续我会继续补充更新。

以上这篇Python查找文件中包含中文的行方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python ORM框架SQLAlchemy学习笔记之映射类使用实例和Session会话介绍
Jun 10 Python
Python中if __name__ == "__main__"详细解释
Oct 21 Python
Python优化技巧之利用ctypes提高执行速度
Sep 11 Python
VSCode Python开发环境配置的详细步骤
Feb 22 Python
python opencv捕获摄像头并显示内容的实现
Jul 11 Python
Django单元测试工具test client使用详解
Aug 02 Python
Python人工智能之路 jieba gensim 最好别分家之最简单的相似度实现
Aug 13 Python
python中利用matplotlib读取灰度图的例子
Dec 07 Python
ipython jupyter notebook中显示图像和数学公式实例
Apr 15 Python
python+selenium 简易地疫情信息自动打卡签到功能的实现代码
Aug 22 Python
python 两种方法删除空文件夹
Sep 29 Python
Selenium 安装和简单使用的实现
Dec 04 Python
对python requests发送json格式数据的实例详解
Dec 19 #Python
解决Python下json.loads()中文字符出错的问题
Dec 19 #Python
python执行CMD指令,并获取返回的方法
Dec 19 #Python
python使用response.read()接收json数据的实例
Dec 19 #Python
Python通用循环的构造方法实例分析
Dec 19 #Python
Python实现对字典分别按键(key)和值(value)进行排序的方法分析
Dec 19 #Python
对json字符串与python字符串的不同之处详解
Dec 19 #Python
You might like
提高PHP编程效率 引入缓存机制提升性能
2010/02/15 PHP
laravel-admin的多级联动方法
2019/09/30 PHP
解决jquery1.9不支持browser对象的问题
2013/11/13 Javascript
关于onchange事件在IE和FF下的表现及解决方法
2014/03/08 Javascript
JavaScript使用二分查找算法在数组中查找数据的方法
2015/04/07 Javascript
js实现左侧网页tab滑动门效果代码
2015/09/06 Javascript
详解nodejs异步I/O和事件循环
2017/06/07 NodeJs
laravel5.4+vue+element简单搭建的示例代码
2017/08/29 Javascript
推荐10款扩展Web表单的JS插件
2017/12/25 Javascript
js数组方法reduce经典用法代码分享
2018/01/07 Javascript
vue cli 全面解析
2018/02/28 Javascript
vue检测对象和数组的变化分析
2018/06/30 Javascript
在微信小程序里使用watch和computed的方法
2018/08/02 Javascript
浅谈angularJS2中的界面跳转方法
2018/08/31 Javascript
详解VUE前端按钮权限控制
2019/04/26 Javascript
Node.js实现简单的爬取的示例代码
2019/06/25 Javascript
layui form.render('select', 'test2') 更新渲染的方法
2019/09/27 Javascript
解决vue初始化项目时,一直卡在Project description上的问题
2019/10/31 Javascript
JS正则表达式验证端口范围(0-65535)
2020/01/06 Javascript
详解vue-template-admin三级路由无法缓存的解决方案
2020/03/10 Javascript
原生JS实现汇率转换功能代码实例
2020/05/13 Javascript
Python反射的用法实例分析
2018/02/11 Python
OPENCV去除小连通区域,去除孔洞的实例讲解
2018/06/21 Python
python基础学习之如何对元组各个元素进行命名详解
2018/07/12 Python
基于python二叉树的构造和打印例子
2019/08/09 Python
python实现的接收邮件功能示例【基于网易POP3服务器】
2019/09/11 Python
Python 根据数据模板创建shapefile的实现
2019/11/26 Python
Python imutils 填充图片周边为黑色的实现
2020/01/19 Python
PyQt5高级界面控件之QTableWidget的具体使用方法
2020/02/23 Python
DeinDesign德国:设计自己的手机壳
2019/12/14 全球购物
日本AOKI官方商城:AOKI西装
2020/06/11 全球购物
密封类可以有虚函数吗
2014/08/11 面试题
2014村党支部书记党建工作汇报材料
2014/11/02 职场文书
幼儿园圣诞节活动总结
2015/05/06 职场文书
2015年乡镇安全生产工作总结
2015/05/19 职场文书
纪念建国70周年演讲稿
2019/07/19 职场文书