Python查找文件中包含中文的行方法


Posted in Python onDecember 19, 2018

前言

近几天在做多语言版本的时候再次发现,区分各种语言真的是一件比较困难的事情,上一次做中文提取工具的就花了不少时间,这次决定用python试一试,结果写起来发现真是方便不少,自己整理了一下方便以后查找使用。

代码

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
# find the line of containing chinese in files

__author__ = 'AlbertS'

import re

def start_find_chinese():
 find_count = 0;
 with open('ko_untranslated.txt', 'wb') as outfile:
  with open('source_ko.txt', 'rb') as infile:
   while True:
    content = infile.readline()
    if re.match(r'(.*[\u4E00-\u9FA5]+)|([\u4E00-\u9FA5]+.*)', content.decode('utf-8')):
     outfile.write(content)
     find_count += 1;

    if not content:
     return find_count

# start to find
if __name__ == '__main__':
 count = start_find_chinese()
 print("find complete! count =", count)

原始文件

source_ko.txt文件内容

3 캐릭터 Lv.50 달성
8 캐릭터 Lv.80 달성
10 캐릭터 Lv.90 달성
...
...
2840 飞黄腾达
4841 同归于尽
8848 캐릭터 Lv.50 달

运行效果(ko_untranslated.txt文件)

2840 飞黄腾达
4841 同归于尽

总结

1. 其实这段小小的代码中包含了两个常用的功能,那就是读写文件和正则表达式。

2. 这也是两个重要的知识点,其中with操作可能防止资源泄漏,操作起来更加方便。

3. 正则表达式可是一个文字处理的利器,代码中的正则可能还不太完善,后续我会继续补充更新。

以上这篇Python查找文件中包含中文的行方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python通过urllib2爬网页上种子下载示例
Feb 24 Python
在CMD命令行中运行python脚本的方法
May 12 Python
Python3单行定义多个变量或赋值方法
Jul 12 Python
Python实现针对json中某个关键字段进行排序操作示例
Dec 25 Python
Django中多种重定向方法使用详解
Jul 17 Python
Python3中urlencode和urldecode的用法详解
Jul 23 Python
Django跨域资源共享问题(推荐)
Mar 09 Python
python使用多线程+socket实现端口扫描
May 28 Python
Django封装交互接口代码
Jul 12 Python
为了顺利买到演唱会的票用Python制作了自动抢票的脚本
Oct 16 Python
pandas时间序列之pd.to_datetime()的实现
Jun 16 Python
python可视化分析绘制带趋势线的散点图和边缘直方图
Jun 25 Python
对python requests发送json格式数据的实例详解
Dec 19 #Python
解决Python下json.loads()中文字符出错的问题
Dec 19 #Python
python执行CMD指令,并获取返回的方法
Dec 19 #Python
python使用response.read()接收json数据的实例
Dec 19 #Python
Python通用循环的构造方法实例分析
Dec 19 #Python
Python实现对字典分别按键(key)和值(value)进行排序的方法分析
Dec 19 #Python
对json字符串与python字符串的不同之处详解
Dec 19 #Python
You might like
56.com视频采集接口程序(PHP)
2007/09/22 PHP
PHP XML操作类DOMDocument
2009/12/16 PHP
php命令行用法入门实例教程
2014/10/27 PHP
优化javascript的执行速度
2010/01/23 Javascript
javascript动画浅析
2012/08/30 Javascript
一行代码实现纯数据json对象的深度克隆实现思路
2013/01/09 Javascript
JQuery为textarea添加maxlength属性并且兼容IE
2013/04/25 Javascript
extjs 如何给column 加上提示
2014/07/29 Javascript
javascript正则表达式参数/g与/i及/gi的使用指南
2014/08/27 Javascript
angularjs的一些优化小技巧
2014/12/06 Javascript
js获取会话框prompt的返回值的方法
2015/01/10 Javascript
jquery实现鼠标经过显示下划线的渐变下拉菜单效果代码
2015/08/24 Javascript
在JavaScript中调用Java类和接口的方法
2016/09/07 Javascript
Vue.js动态添加、删除选题的实例代码
2016/09/30 Javascript
Angularjs渲染的 using 指令的星级评分系统示例
2017/11/09 Javascript
解决在vue项目中,发版之后,背景图片报错,路径不对的问题
2018/03/06 Javascript
详解如何在Angular优雅编写HTTP请求
2018/12/05 Javascript
浅谈layer的Icon样式以及一些常用的layer窗口使用方法
2019/09/11 Javascript
javascript(基于jQuery)实现鼠标获取选中的文字示例【测试可用】
2019/10/26 jQuery
vue data引入本地图片的两种方式小结
2019/11/13 Javascript
[49:42]DOTA2上海特级锦标赛主赛事日 - 3 胜者组第二轮#2Secret VS EG第一局
2016/03/04 DOTA
[11:33]DAC2018 4.5SOLO赛决赛 MidOne vs Paparazi第二场
2018/04/06 DOTA
Python加pyGame实现的简单拼图游戏实例
2015/05/15 Python
python如何在终端里面显示一张图片
2016/08/17 Python
Python插件virtualenv搭建虚拟环境
2017/11/20 Python
python opencv旋转图像(保持图像不被裁减)
2018/07/26 Python
python实现串口自动触发工作的示例
2019/07/02 Python
Python 70行代码实现简单算式计算器解析
2019/08/30 Python
衰败城市英国官网:Urban Decay英国
2020/04/29 全球购物
在使用非全零作为空指针内部表达的机器上, NULL是如何定义
2014/11/09 面试题
医学生实习自荐信
2013/10/01 职场文书
工艺工程师工作职责
2013/11/23 职场文书
仓库保管员岗位职责
2013/12/20 职场文书
个人党性分析总结
2015/03/05 职场文书
2015年大学辅导员工作总结
2015/05/12 职场文书
《月歌。》宣布制作10周年纪念剧场版《RABBITS KINGDOM THE MOVIE》
2022/04/02 日漫