Python查找文件中包含中文的行方法


Posted in Python onDecember 19, 2018

前言

近几天在做多语言版本的时候再次发现,区分各种语言真的是一件比较困难的事情,上一次做中文提取工具的就花了不少时间,这次决定用python试一试,结果写起来发现真是方便不少,自己整理了一下方便以后查找使用。

代码

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
# find the line of containing chinese in files

__author__ = 'AlbertS'

import re

def start_find_chinese():
 find_count = 0;
 with open('ko_untranslated.txt', 'wb') as outfile:
  with open('source_ko.txt', 'rb') as infile:
   while True:
    content = infile.readline()
    if re.match(r'(.*[\u4E00-\u9FA5]+)|([\u4E00-\u9FA5]+.*)', content.decode('utf-8')):
     outfile.write(content)
     find_count += 1;

    if not content:
     return find_count

# start to find
if __name__ == '__main__':
 count = start_find_chinese()
 print("find complete! count =", count)

原始文件

source_ko.txt文件内容

3 캐릭터 Lv.50 달성
8 캐릭터 Lv.80 달성
10 캐릭터 Lv.90 달성
...
...
2840 飞黄腾达
4841 同归于尽
8848 캐릭터 Lv.50 달

运行效果(ko_untranslated.txt文件)

2840 飞黄腾达
4841 同归于尽

总结

1. 其实这段小小的代码中包含了两个常用的功能,那就是读写文件和正则表达式。

2. 这也是两个重要的知识点,其中with操作可能防止资源泄漏,操作起来更加方便。

3. 正则表达式可是一个文字处理的利器,代码中的正则可能还不太完善,后续我会继续补充更新。

以上这篇Python查找文件中包含中文的行方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python爬虫之模拟知乎登录的方法教程
May 25 Python
Python:Numpy 求平均向量的实例
Jun 29 Python
python django model联合主键的例子
Aug 06 Python
python 遗传算法求函数极值的实现代码
Feb 11 Python
python对Excel的读取的示例代码
Feb 14 Python
keras实现调用自己训练的模型,并去掉全连接层
Jun 09 Python
keras分类模型中的输入数据与标签的维度实例
Jul 03 Python
python 读取、写入txt文件的示例
Sep 27 Python
Python基于callable函数检测对象是否可被调用
Oct 16 Python
python cv2图像质量压缩的算法示例
Jun 04 Python
python中数组和列表的简单实例
Mar 25 Python
python数据处理之Pandas类型转换
Apr 28 Python
对python requests发送json格式数据的实例详解
Dec 19 #Python
解决Python下json.loads()中文字符出错的问题
Dec 19 #Python
python执行CMD指令,并获取返回的方法
Dec 19 #Python
python使用response.read()接收json数据的实例
Dec 19 #Python
Python通用循环的构造方法实例分析
Dec 19 #Python
Python实现对字典分别按键(key)和值(value)进行排序的方法分析
Dec 19 #Python
对json字符串与python字符串的不同之处详解
Dec 19 #Python
You might like
绿山咖啡和蓝山咖啡
2021/03/04 新手入门
一个用于MySQL的PHP XML类
2006/10/09 PHP
php中file_get_content 和curl以及fopen 效率分析
2014/09/19 PHP
php ImageMagick windows下安装教程
2015/01/26 PHP
php通过淘宝API查询IP地址归属等信息
2015/12/25 PHP
php实现的debug log日志操作类实例
2016/07/12 PHP
PHP strcmp()和strcasecmp()的区别实例
2016/11/05 PHP
php  单例模式详细介绍及实现源码
2016/11/05 PHP
浅谈php使用curl模拟多线程发送请求
2019/03/08 PHP
js 自动播放的实例代码
2013/11/19 Javascript
JavaScript中的null和undefined区别介绍
2015/01/01 Javascript
JavaScript中toString()方法的使用详解
2015/06/05 Javascript
js+html5实现canvas绘制圆形图案的方法
2015/06/05 Javascript
浏览器检测JS代码(兼容目前各大主流浏览器)
2016/02/21 Javascript
JS模拟的Map类实现方法
2016/06/17 Javascript
JavaScript中闭包的写法和作用详解
2016/06/29 Javascript
详解Nodejs的timers模块
2016/12/22 NodeJs
vue基于Vue2.0和高德地图的地图组件实例
2017/04/28 Javascript
简单谈谈JS中的正则表达式
2017/09/11 Javascript
详解node+express+ejs+bootstrap构建项目
2017/09/27 Javascript
jquery中有哪些api jQuery主要API
2017/11/20 jQuery
使用Vue自定义指令实现Select组件
2018/05/24 Javascript
JS代码简洁方式之函数方法详解
2020/07/28 Javascript
linux服务器快速卸载安装node环境(简单上手)
2021/02/22 Javascript
Python冒泡排序注意要点实例详解
2016/09/09 Python
Python运算符重载详解及实例代码
2017/03/07 Python
Python实现检测文件MD5值的方法示例
2018/04/11 Python
python实现的登录与提交表单数据功能示例
2019/09/25 Python
Python读写Excel表格的方法
2021/03/02 Python
街头时尚在线:JESSICABUURMAN
2019/06/16 全球购物
如何写好升职自荐信
2014/01/06 职场文书
2014年小学少先队工作总结
2014/12/18 职场文书
新员工考核评语
2014/12/31 职场文书
2015年店长工作总结范文
2015/04/08 职场文书
民主生活会意见
2015/06/05 职场文书
详解Vue slot插槽
2021/11/20 Vue.js