Python查找文件中包含中文的行方法


Posted in Python onDecember 19, 2018

前言

近几天在做多语言版本的时候再次发现,区分各种语言真的是一件比较困难的事情,上一次做中文提取工具的就花了不少时间,这次决定用python试一试,结果写起来发现真是方便不少,自己整理了一下方便以后查找使用。

代码

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
# find the line of containing chinese in files

__author__ = 'AlbertS'

import re

def start_find_chinese():
 find_count = 0;
 with open('ko_untranslated.txt', 'wb') as outfile:
  with open('source_ko.txt', 'rb') as infile:
   while True:
    content = infile.readline()
    if re.match(r'(.*[\u4E00-\u9FA5]+)|([\u4E00-\u9FA5]+.*)', content.decode('utf-8')):
     outfile.write(content)
     find_count += 1;

    if not content:
     return find_count

# start to find
if __name__ == '__main__':
 count = start_find_chinese()
 print("find complete! count =", count)

原始文件

source_ko.txt文件内容

3 캐릭터 Lv.50 달성
8 캐릭터 Lv.80 달성
10 캐릭터 Lv.90 달성
...
...
2840 飞黄腾达
4841 同归于尽
8848 캐릭터 Lv.50 달

运行效果(ko_untranslated.txt文件)

2840 飞黄腾达
4841 同归于尽

总结

1. 其实这段小小的代码中包含了两个常用的功能,那就是读写文件和正则表达式。

2. 这也是两个重要的知识点,其中with操作可能防止资源泄漏,操作起来更加方便。

3. 正则表达式可是一个文字处理的利器,代码中的正则可能还不太完善,后续我会继续补充更新。

以上这篇Python查找文件中包含中文的行方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
日常整理python执行系统命令的常见方法(全)
Oct 22 Python
Python爬虫之模拟知乎登录的方法教程
May 25 Python
python计算auc指标实例
Jul 13 Python
Python父目录、子目录的相互调用方法
Feb 16 Python
如何用Python来搭建一个简单的推荐系统
Aug 07 Python
Pandas操作CSV文件的读写实现方法
Nov 13 Python
Python函数的返回值、匿名函数lambda、filter函数、map函数、reduce函数用法实例分析
Dec 26 Python
python GUI库图形界面开发之PyQt5复选框控件QCheckBox详细使用方法与实例
Feb 28 Python
Pycharm生成可执行文件.exe的实现方法
Jun 02 Python
Tensorflow之MNIST CNN实现并保存、加载模型
Jun 17 Python
解决Pytorch自定义层出现多Variable共享内存错误问题
Jun 28 Python
opencv实现图像几何变换
Mar 24 Python
对python requests发送json格式数据的实例详解
Dec 19 #Python
解决Python下json.loads()中文字符出错的问题
Dec 19 #Python
python执行CMD指令,并获取返回的方法
Dec 19 #Python
python使用response.read()接收json数据的实例
Dec 19 #Python
Python通用循环的构造方法实例分析
Dec 19 #Python
Python实现对字典分别按键(key)和值(value)进行排序的方法分析
Dec 19 #Python
对json字符串与python字符串的不同之处详解
Dec 19 #Python
You might like
[FAQ]PHP中的一些常识:类篇
2006/10/09 PHP
解析isset与is_null的区别
2013/08/09 PHP
将php数组输出html表格的方法
2014/02/24 PHP
destoon实现资讯信息前面调用它所属分类的方法
2014/07/15 PHP
yii实现model添加默认值的方法(2种方法)
2016/01/06 PHP
php中通过eval实现字符串格式的计算公式
2017/03/18 PHP
Javascript模板技术
2007/04/27 Javascript
JavaScript 拾漏补遗
2009/12/27 Javascript
jQuery学习笔记(1)--用jQuery实现异步通信(用json传值)具体思路
2013/04/08 Javascript
jquery获取当前元素索引值用法实例
2015/06/10 Javascript
jquery实现未经美化的简洁TAB菜单效果
2015/08/28 Javascript
jQuery通过ajax快速批量提交表单数据
2016/10/25 Javascript
thinkphp标签实现bootsrtap轮播carousel实例代码
2017/02/19 Javascript
利用Node.js+Koa框架实现前后端交互的方法
2017/02/27 Javascript
深入理解JavaScript继承的多种方式和优缺点
2017/05/12 Javascript
js 实现复选框只能选择一项的示例代码
2018/01/23 Javascript
新版vue-cli模板下本地开发环境使用node服务器跨域的方法
2018/04/03 Javascript
vue router 跳转后回到顶部的实例
2018/08/31 Javascript
JavaScript setTimeout()基本用法有哪些
2020/11/04 Javascript
原生js实现自定义难度的扫雷游戏
2021/01/22 Javascript
Python中的两个内置模块介绍
2015/04/05 Python
Windows下Python的Django框架环境部署及应用编写入门
2016/03/10 Python
PyQt5实现拖放功能
2018/04/25 Python
python word转pdf代码实例
2019/08/16 Python
pytorch 预训练层的使用方法
2019/08/20 Python
Python hashlib加密模块常用方法解析
2019/12/18 Python
解决Python图形界面中设置尺寸的问题
2020/03/05 Python
CSS3自定义滚动条样式 ::webkit-scrollbar的示例代码详解
2020/06/01 HTML / CSS
Furla官网:意大利著名的皮革品牌
2019/08/06 全球购物
Java Servlet API中forward() 与redirect()的区别
2014/04/20 面试题
秘书英文求职信范文
2014/01/31 职场文书
小学运动会口号
2014/06/07 职场文书
2014年环保局工作总结
2014/12/11 职场文书
婚庆司仪开场白
2015/05/29 职场文书
单身证明范本
2015/06/15 职场文书
Ruby GDBM操作简介及数据存储原理
2022/04/19 Ruby